伍德伯里矩阵恒等式(Woodbury matrix identity)

时间:2022-06-26 07:29:22

宜言饮酒,与子偕老。琴瑟在御,莫不静好。

更多精彩内容请关注微信公众号 “优化与算法

在数学(特别是线性代数)中,Woodbury矩阵恒等式是以Max A.Woodbury命名的,它 可以通过对原矩阵的逆进行秩k校正来计算某个矩阵的秩k校正的逆。这个公式的另一个名字是矩阵逆引理,谢尔曼-莫里森-伍德伯里(Sherman–Morrison–Woodbury formula)公式或只是伍德伯里公式。然而,在伍德伯里发现之前,这一等式出现在其他文献中。

1. 伍德伯里矩阵恒等式

[displaystyle left(A UCVright)^{-1}=A^{-1}-A^{-1}Uleft(C^{-1} VA^{-1}Uright)^{-1}VA^{-1}]

其中(A)(U)(C)(V)都表示适形尺寸的矩阵。具体来说,(A) 的大小为 (n×n)(U)(n×k)(C)(k×k)(V)(k×n)

2. 扩展

不失一般性,可用单位矩阵替换矩阵A和C:
[displaystyle left(I UVright)^{-1}=I-Uleft(I VUright)^{-1}V]

这里(displaystyle U=A^{-1}X), (displaystyle V=CY)

这个等式本身可以看作是两个简单等式的组合,即等式
[displaystyle (I P)^{-1}=I-(I P)^{-1}P=I-P(I P)^{-1}]

和所谓的 push-through 等式
[displaystyle (I UV)^{-1}U=U(I VU)^{-1}]的结合。

3. 特殊情况

(displaystyle V,U) 是向量时,伍德伯里恒等式退化为谢尔曼-莫里森公式,在标量情况下,它(简化版)只是:
[displaystyle {frac {1}{1 uv}}=1-{frac {uv}{1 uv}}]

如果 (p=q)(U=V=I_p) 是单位矩阵,那么
[ left({A} {B}right)^{-1} =A^{-1}-A^{-1}(B^{-1} A^{-1})^{-1}A^{-1}]

[={A}^{-1}-{A}^{-1}left({I} {B}{A}^{-1}right)^{-1}{B}{A}^{-1}.]
继续合并上述方程最右边的项,就可以得到一下恒等式:
[displaystyle left({A} {B}right)^{-1}={A}^{-1}-left({A} {A}{B}^{-1}{A}right)^{-1}]

此等式的另一个有用的形式是:
[displaystyle left({A}-{B}right)^{-1}={A}^{-1} {A}^{-1}{B}left({A}-{B}right)^{-1}]

它有一个递归结构:
[displaystyle left({A}-{B}right)^{-1}=sum _{k=0}^{infty }left({A}^{-1}{B}right)^{k}{A}^{-1}]

这种形式可用于微扰展开式,其中 (B)(A) 的微扰。

4. 推广

二项式逆定理(Binomial Inverse Theorem)
如果 (A)(U)(B)(V) 分别是 (p×p)(p×q)(q×q)(q×p)的矩阵,那么:
[displaystyle left(A UBVright)^{-1}=A^{-1}-A^{-1}UBleft(B BVA^{-1}UBright)^{-1}BVA^{-1}]

前提是 (A)(B BVA-1UB) 是非奇异的。后者的非奇异性要求 (B^{-1}) 存在,因为它等于 (B(I VA=1ub)),并且后者的秩不能超过 (B) 的秩。由于 (B) 是可逆的,所以在右手边的附加量逆的两边的两个 (B) 项可以被 ((B^{-1})^{-1}) 替换,从而得到原始的Woodbury恒等式:
[displaystyle (A UBV)^{-1}=A^{-1}-A^{-1}U(I BVA^{-1}U)^{-1}BVA^{-1}]

在某些情况下,(A) 是有可能是奇异的。

5. 延伸

公式可以通过检查 (A UCV) 乘以伍德伯里恒等式右侧的所谓逆得到恒等式矩阵来证明:
(left(A UCVright)left[A^{-1}-A^{-1}Uleft(C^{-1} VA^{-1}Uright)^{-1}VA^{-1}right])
(={}left{I-Uleft(C^{-1} VA^{-1}Uright)^{-1}VA^{-1}right} left{UCVA^{-1}-UCVA^{-1}Uleft(C^{-1} VA^{-1}Uright)^{-1}VA^{-1}right}={})
(left{I UCVA^{-1}right}-left{Uleft(C^{-1} VA^{-1}Uright)^{-1}VA^{-1} UCVA^{-1}Uleft(C^{-1} VA^{-1}Uright)^{-1}VA^{-1}right}=)
( UCVA^{-1}-left(U UCVA^{-1}Uright)left(C^{-1} VA^{-1}Uright)^{-1}VA^{-1}=)
( UCVA^{-1}-UCleft(C^{-1} VA^{-1}Uright)left(C^{-1} VA^{-1}Uright)^{-1}VA^{-1} UCVA^{-1}-UCVA^{-1}left({A} {B}right)^{-1}) (=A^{-1}-A^{-1}(B^{-1} A^{-1})^{-1}A^{-1})$
[={A}^{-1}-{A}^{-1}left({I} {B}{A}^{-1}right)^{-1}{B}{A}^{-1}.].

参考文献

https://en.wikipedia.org/wiki/Woodbury_matrix_identity

更多精彩内容请关注微信公众号 “优化与算法

伍德伯里矩阵恒等式(Woodbury matrix identity)