机器学习中的一些易混淆术语

时间:2024-03-14 18:06:07

机器学习的术语机器学习领域非常广泛,而且因为有许多科学家来自其他的研究领域,因此学科的交叉现象比较严重。很多似曾相识的术语和概念被重新认识或者定义,名称可能会有所不同。为方便起见,下面精选了常用术语及其同义词,希望对大家阅读本书和其他人工智能书籍有所帮助。

  • 训练样本:表中的行,代表数据集的观察、记录、个体或者样本(在多数情况下,样本指训练样本集)。
  • 训练:模型拟合,对参数型模型而言,类似参数估计。
  • 特征,缩写为x:指数据表或矩阵的列。与预测因子、变量、输入、属性或协变量同义。
  • 目标,缩写为y:与结果、输出、响应变量、因变量、分类标签和真值同义。
  • 损失函数:经常与代价函数同义。有时也被称为误差函数。在有些文献中,术语损失指的是对单个数据点进行测量的损失,而代价是对整个数据集进行测量(平均或者求和)的损失。

摘自:塞巴斯蒂安等的《Python机器学习(原书第三版)》