无监督学习Unsupervised learning

无监督学习的特点是训练数据没有标签，无监督学习识别和利用数据中的模式进行诸如数据压缩或降维（如自编码器）或生成模型（如GAN等）之类的任务。

数据的压缩和降维涉及到使用比原始数据表示更少的信息进行编码。

生成模型可以对训练及数据的分布进行逼近，然后从该近似分布中生成新的数据点。

无监督学习与有监督学习存在两点不同：

1. 有监督学习属于条件密度估计，而无监督学习为无条件密度估计。

2. 无监督学习一般需要创建多变量概率模型。而有监督学习的预测值通常是一个单变量，因此大多数有监督学习问题我们可以采用单变量概率模型，其大大简化了问题。

但是对于多输出的有监督分类问题仍需要多变量的概率模型。

无监督学习Unsupervised learning

无监督学习更像人类或动物的学习方式。相比于有监督学习，无监督学习有着更广泛的适用性，因为其不需要人类专家进行标签制作。

标签不仅昂贵，而且相比于原始数据信息量大大减小，其不足以可靠地估计复杂模型的参数。

获得丰富信息最好的方式是信息输入本身。

无监督学习Unsupervised learning

聚类

数据降维，主成分分析

发现图结构

数据 / 矩阵补全（图像修复，协同过滤，Market basket analysis ）