【机器学习】特征选择之包裹式特征选择法-一 初步了解

时间:2024-04-16 08:47:37

1.1 概念

包裹式特征选择法是机器学习中一种常用的特征选择方法,其核心思想是将特征选择问题转化为一个优化问题,通过搜索特征子集的方式来选择最佳的特征组合,以提高模型性能。

与过滤式特征选择方法不同,包裹式特征选择法直接利用模型的性能来评估特征子集的好坏,因此更加贴近实际应用场景。

在包裹式特征选择法中,通常会先选定一个机器学习模型作为评价器,然后通过尝试不同的特征子集来训练模型,并使用交叉验证或留出法等技术来评估模型的性能。

根据评估指标的变化,可以选择最佳的特征子集作为最终的特征组合。

1.2 类比

想象你是一位厨师,正在准备一道美味的菜肴。

你有一系列食材(特征),但你知道并不是每种食材都对最终的菜肴有同样的贡献。

有些食材可能是关键的,而另一些可能只是起到点缀作用。

现在,你的目标是选择最佳的食材组合,以制作出口感最好的菜肴(模型性能最佳)。

这里,包裹式特征选择法就像是你在尝试不同的食材组合来制作菜肴一样。

你会尝试不同的组合,然后根据口味(模型性能)来评估每种组合的好坏。

你可能会制作几个小样本(交叉验证)或是留出一部分菜品来在最后评估(留出法),以确保你的评价是准确的。

最终,你会选择口味最佳的食材组合作为最终的菜肴配方(最佳的特征子集)。

这样,你就能够在尽量节省成本的情况下制作出最令人喜欢的菜肴。