Ncut
同样,Ncut的目标,也是极小化各子图连边的和,如下:
min Ncut(A1,A2,A3,...,Ak)
同样,引入{A1,A2,⋯,Ak}的指示向量hj={hj1,hj2,...,hjn},j=1,2...,k.其中i表示样本下标,j表示子集下标, 表示样本i对子集j的指示,具体为:
进一步,计算,可以得到:
, 推导过程与ratioCut几乎完全相同
此外,相比与Ratiocut,Ncut特有的一点性质是:,具体如下:
同样,可以得到:





以及:
至此,目标操作可以修改为:
其中,


最后,F矩阵的求解可通过求

之后再对F的行进行kmeans或GMM聚类即可。
以上是Ncut的内容。
谱聚类中的矩阵:
可见不管是L、L’都与E联系特别大。如果将E看成一个高维向量空间,也能在一定程度上反映item之间的关系。将E直接kmeans聚类,得到的结果也能反映V的聚类特性,而谱聚类的引入L和L’是使得G的分割具有物理意义。
而且,如果E的item(即n)足够大,将难计算出它的kmeans,我们完全可以用PCA降维(仍为top的特征值与向量)。
上述对将E当成向量空间矩阵,直观地看符合我们的认知,但缺乏理论基础;而L(L’等)的引入,如第2节所述,使得计算具有理论基础,其前k个特征向量,也等价于对L(L’等)的降维。
因而聚类就是为图的划分找了理论基础,能达到降维的目的。