黎曼几何和李群在图像处理中的应用(1)

时间:2023-02-10 17:25:27

现如今,无论是计算机视觉和医学图像处理,都把视角从对欧式空间的研究转到了对流形(Manifold)的研究。所以对黎曼几何和李群的理解显得尤为重要。这里就从一些图像和视觉问题的实例来介绍黎曼几何和李群。


流形(Manifold)

流形,其性质是每个细微局部可以看做是欧式空间,可以看做曲线(1D),曲面(2D)的扩展。


研究意义

其实大多数数据并不存在于欧式空间中,而是存在于某一个流形空间内。最简单的,用v表示一条数据(先暂且把他看做一个n维向量),可以是人脸部的形状特征,可以是一张CT图像的灰度,甚至可以是一段视频的内容。就比如v表示一张照片中人脸的形状,每条数据记录了k个轮廓点的位置(v=x1,x2,...,xk). 为了去除不同照片大小带来的尺度差异,一般的做法是将数据归一化,即使得

黎曼几何和李群在图像处理中的应用(1)

我们发现这样一来,此类数据其实存在于k-1维的圆上。那么问题是,给定两个脸部形状数据v1和v2,怎么求平均的脸部形状呢?如果将其看成是欧式空间的数据,那么平均值为1/2(v1+v2),但是这个结果根本就不在k-1维的圆上!

对于更复杂的问题,数据可能存在于圆以外的更复杂的流形之上,所以这就引出了对流形操作的概念。比如,数据求平均值不应该用一般的欧式平均,而应该采用流形上的Frechet Mean。欧式空间的线性回归(Linear Regression)对应了流形上的Geodesic Regresstion. 欧式空间中的PCA就变成了PGA (Principal Geodesic Analysis)。 也有一些方法把数据转化到某个切平面中,在用一般的欧式空间方法分析。

另一方面,图像的形变与转化,比如平移,旋转,similarity transform,或者一般的微分同胚映射(Diffeomorphism),这些转换即可以看成是群结构,也可以看成是流形。这就引出了李群(Lie Groups)在图像处理中的应用。比如医学图像配准中,为了研究类似流体的平滑形变(LDDMM),李群给出了一套很好的框架,使得对于平滑形变的求解和统计分析可以在单位形变的切平面上完成。

总而言之,对于黎曼几何和李群的了解有助于图像处理类工作的研究。

之后将讨论更为细节的数学与应用。