Matrix

matrix definition

\(m \times n\) 维矩阵表示

\[\begin{split}\begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1m} \\ a_{21} & a_{22} & \cdots & a_{2m} \\ \vdots & \vdots & \cdots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{mn} \end{bmatrix}_{m\times n}\end{split}\]

matrix operation

\(3 \times 3\) dimension matrix ADD :

\[\begin{split}A_{3 \times 3} + B_{3 \times 3} = \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{bmatrix}_{3 \times 3} + \begin{bmatrix} b_{11} & b_{12} & b_{13} \\ b_{21} & b_{22} & b_{23} \\ b_{31} & b_{32} & b_{33} \end{bmatrix}_{3 \times 3} = \begin{bmatrix} a_{11}+b_{11} & a_{12}+b_{12} & a_{13}+b_{13} \\ a_{21}+b_{21} & a_{22}+b_{22} & a_{23}+b_{23} \\ a_{31}+b_{31} & a_{32}+b_{32} & a_{33}+b_{33} \end{bmatrix}_{3 \times 3}\end{split}\]

\(3 \times 3\) dimension matrix MINUS :

\[\begin{split}A_{3 \times 3} - B_{3 \times 3} = \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{bmatrix}_{3 \times 3} - \begin{bmatrix} b_{11} & b_{12} & b_{13} \\ b_{21} & b_{22} & b_{23} \\ b_{31} & b_{32} & b_{33} \end{bmatrix}_{3 \times 3} = \begin{bmatrix} a_{11}-b_{11} & a_{12}-b_{12} & a_{13}-b_{13} \\ a_{21}-b_{21} & a_{22}-b_{22} & a_{23}-b_{23} \\ a_{31}-b_{31} & a_{32}-b_{32} & a_{33}-b_{33} \end{bmatrix}_{3 \times 3}\end{split}\]

\(3 \times 3\) dimension matrix MULTIPLY :

\[\begin{split}\begin{align} A_{3 \times 3} B_{3 \times 3} &= \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{bmatrix}_{3 \times 3} \begin{bmatrix} b_{11} & b_{12} & b_{13} \\ b_{21} & b_{22} & b_{23} \\ b_{31} & b_{32} & b_{33} \end{bmatrix}_{3 \times 3} \\ &= \begin{bmatrix} a_{11}b_{11} + a_{12} b_{21}+ a_{13} b_{31} & a_{11}b_{12} + a_{12} b_{22}+ a_{13} b_{32} & a_{11}b_{13} + a_{12} b_{23}+ a_{13} b_{33} \\ a_{21}b_{11} + a_{22} b_{21}+ a_{23} b_{31} & a_{21}b_{12} + a_{22} b_{22}+ a_{23} b_{32} & a_{21}b_{13} + a_{22} b_{23}+ a_{23} b_{33} \\ a_{31}b_{11} + a_{32} b_{21}+ a_{33} b_{31} & a_{31}b_{12} + a_{32} b_{22}+ a_{33} b_{32} & a_{31}b_{13} + a_{32} b_{23}+ a_{33} b_{33} \\ \end{bmatrix}_{3 \times 3} \end{align}\end{split}\]

Viewing a Matrix 4 ways

../../_images/matrix_1.png

Vector times Vector 2 ways

../../_images/matrix_2.png

Matrix times Vector 2 ways

../../_images/matrix_3.png
../../_images/matrix_4.png
../../_images/matrix_5.png

Matrix times Matrix 4 ways

../../_images/matrix_6.png

Practical Pattern

../../_images/matrix_7.png
../../_images/matrix_8.png
../../_images/matrix_9.png
../../_images/matrix_10.png
../../_images/matrix_11.png

Matrix Factorization

../../_images/matrix_12.png

A = CR

../../_images/matrix_13.png

A = LU

../../_images/matrix_14.png

A = QR

../../_images/matrix_15.png

A = \(QAQ^T\)

../../_images/matrix_16.png

A = \(U \Sigma V^T\)

../../_images/matrix_17.png

Matrix World

../../_images/matrix_18.png

Schur Complements

\(M\) 是一个 \(n × n\) 矩阵,写成 \(2 × 2\) 块矩阵

\[\begin{split}\begin{bmatrix} A & B \\ C & D \end{bmatrix}\end{split}\]

其中 \(A\) 是一个 \(p × p\) 矩阵,\(D\) 是一个:math:q × q 矩阵,其中 \(n = p + q\) (所以,\(B\) 是一个 \(q × p\) 矩阵)。 我们可以尝试求解线性系统:

\[\begin{split}\begin{bmatrix} A & B \\ C & D \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} c \\ d \end{bmatrix}\end{split}\]

那么

\[\begin{split}Ax + By = c \\ Cx + Dy = d\end{split}\]

通过模仿高斯消元法,即假设 \(D\) 是可逆的,我们首先求解 \(y\) 得到:

\[y = D^{-1}(d - Cx)\]

在第一个方程中用这个表达式代替 \(y\) 后,我们得到:

\[Ax + B(D^{-1}(d - Cx)) = c\]

那么

\[(A - BD^{-1}C)x = c - BD^{-1}d\]

如果矩阵:math:A - BD^{-1}C 是可逆的,那么我们得到系统的解

\[\begin{split}\begin{aligned} x &= (A - BD^{-1}C)^{-1}(c - BD^{-1}d) \\ y &= D^{-1}(d - C(A-BD^{-1}C)^{-1}(c - BD^{-1}d)) \end{aligned}\end{split}\]

矩阵 \(A − BD^{−1}C\) 称为 \(D\)\(M\) 中的舒尔补。如果 \(A\) 是可逆的,那么通过首先使用第一个方程消除 \(x\) 我们发现 \(A\)\(M\) 中的舒尔补是 \(D − CA^{−1}B\) ( 这对应于当 \(C = B^{T}\) 时 Boyd 和 Vandenberghe 中定义的 Schur 补

上述方程写为:

\[\begin{split}\begin{aligned} x &= (A - BD^{-1}C)^{-1}c - (A - BD^{-1}C)^{-1}BD^{-1}d \\ y &= -D^{-1}C(A-BD^{-1}C)^{-1}c + (D^{-1} + D^{-1}C(A - BD^{-1}C)BD^{-1})d \end{aligned}\end{split}\]

根据 \(M\)\(D\) 的 Schur 补,产生 \(M\) 的逆的公式,即

\[\begin{split}\begin{bmatrix} A & B \\ C & D \end{bmatrix}^{-1} = \begin{bmatrix} (A - BD^{-1}C)^{-1} & -(A - BD^{-1}C)^{-1}BD^{-1} \\ -D^{-1}C(A-BD^{-1}C)^{-1} & D^{-1} + D^{-1}C(A - BD^{-1}C)BD^{-1} \end{bmatrix}\end{split}\]

片刻的反思

\[\begin{split}\begin{bmatrix} A & B \\ C & D \end{bmatrix}^{-1} = \begin{bmatrix} (A - BD^{-1}C)^{-1} & 0 \\ -D^{-1}C(A-BD^{-1}C)^{-1} & D^{-1} \end{bmatrix} \begin{bmatrix} I & -BD^{-1} \\ 0 & I \end{bmatrix}\end{split}\]

然后

\[\begin{split}\begin{bmatrix} A & B \\ C & D \end{bmatrix}^{-1} = \begin{bmatrix} I & 0 \\ -D^{-1}C & I \end{bmatrix} \begin{bmatrix} (A - BD^{-1}C)^{-1} & 0 \\ 0 & D^{-1} \end{bmatrix} \begin{bmatrix} I & -BD^{-1} \\ 0 & I \end{bmatrix}\end{split}\]

紧接着就是

\[\begin{split}\begin{bmatrix} A & B \\ C & D \end{bmatrix} = \begin{bmatrix} I & BD^{-1} \\ 0 & I \end{bmatrix} \begin{bmatrix} A - BD^{-1}C & 0 \\ 0 & D \end{bmatrix} \begin{bmatrix} I & 0 \\ D^{-1}C & I \end{bmatrix}\end{split}\]

上式可以直接查,优点是只要求:math:D 的可逆性。

备注:如果 \(A\) 的 Schur 补码 \(D − CA^{−1}B\) 来获得 \(M\) 的以下因式分解:

\[\begin{split}\begin{bmatrix} A & B \\ C & D \end{bmatrix} = \begin{bmatrix} I & 0 \\ CA^{-1} & I \end{bmatrix} \begin{bmatrix} A & 0 \\ 0 & D - CA^{-1}B \end{bmatrix} \begin{bmatrix} I & A^{-1}B \\ 0 & I \end{bmatrix}\end{split}\]

如果 \(D−CA^{−1}B\) 是可逆的,我们可以将上面的所有三个矩阵求逆,我们可以得到另一个公式,用 \((D−CA^{−1}B)\) 表示 \(M\) 的逆,即

\[\begin{split}\begin{bmatrix} A & B \\ C & D \end{bmatrix}^{-1} = \begin{bmatrix} A^{-1} + A^{-1}B(D- CA^{-1}B)CA^{-1} & -A^{-1}B(D- CA^{-1}B)CA^{-1} \\ -(D- CA^{-1}B)CA^{-1} & (D- CA^{-1}B)^{-1} \end{bmatrix}\end{split}\]

如果 \(A, D\) 和两个 Schur 补 \(A − BD^{−1}C\)\(D − CA^{−1}B\) 都是可逆的,则比较 \(M^{−1}\) 的两个表达式,我们得到(非显而易见的)公式

\[(A - BD^{-1}C)^{-1} = A^{-1} + A^{-1}B(D- CA^{-1}B)CA^{-1}\]

使用这个公式,我们得到了另一个涉及 \(A\)\(D\) 的 Schur 补码的 \(M\) 逆的表达式

\[\begin{split}\begin{bmatrix} A & B \\ C & D \end{bmatrix}^{-1} = \begin{bmatrix} (A - BD^{-1}C)^{-1} & -A^{-1}B(D-CA^{-1}B)^{-1}) \\ -(D- CA^{-1}B)CA^{-1} & (D- CA^{-1}B)^{-1} \end{bmatrix}\end{split}\]

如果我们设置 \(D = I\) 并将 \(B\) 更改为 \(-B\) 我们得到

\[(A + BC)^{-1} = A^{-1} - A^{-1}B(I - CA^{-1}B)^{-1}CA^{-1}\]

称为矩阵求逆引理的公式

参考