前置知识: 特征值与特征向量
在深入探讨特征向量计算背后的数学原理之前,让我们先简要讨论一下特征值和特征向量到底是什么。
特征值与特征向量:
单词 ‘eigen‘ 意味着 ‘特征‘。一般来说,特征值和特征向量 描述了矩阵或向量的特征。
特征向量:这是一个由矩阵 X 表示的向量,使得当 X 与任意矩阵 A 相乘时,结果矩阵的方向与向量 X 保持一致。请仔细观察 图 1,查看特征向量的图形表示。
!image图 1:特征向量表示
在图 1 中,我们观察到以下标量变换:
\vec{v1‘} = 1.5 (\vec{v1}) \\ \vec{v2‘} = 0.5 (\vec{v2})
应用这些变换后,向量 v1‘ 和 v2‘ 的方向与 v1 和 v2 相同。因此根据我们的定义,这些向量被认为是特征向量。但是结果向量 v3‘ 的方向与 v3 不同。因此它不能被视为特征向量。
特征值: 它告诉我们特征向量被拉伸或缩小的程度。
在上述情况下,特征值将是 1.5 和 0.5。
计算特征向量
我们可以使用矩阵的特征方程来计算任何矩阵的特征值(正如前置知识文章中所讨论的),即:
= 0
上述方程的根(即 λ 的值)给出了我们特征值。
利用获得的 λ 值,我们可以使用下面给出的方程找到对应的特征向量。
在\ \lambda=i时\\ [A-iI ]X_i = 0
示例问题
考虑以下示例以便更好地理解。假设有一个定义的 3×3 矩阵 X:
A = \begin{bmatrix} 1 & 0 & -1\\1 & 2 & 1\\2 & 2 & 3 \end{bmatrix}
求对应于矩阵 A 的特征值和特征向量。
解决方案
1. 寻找特征值。
\\ det(A-\lambda I) = det(\begin{bmatrix} 1-\lambda & 0 & -1\\1 & 2-\lambda & 1\\2 & 2 & 3-\lambda \end{bmatrix}) = 0 \\ \implies (\lambda^3 – 6\lambda^2 +11\lambda -6) = 0 \\ \implies (\lambda – 1)( \lambda – 2)(\lambda -3) = 0 \\ \implies \lambda = 1,2,3
因此,获得的特征值为 1、2 和 3。
2. 寻找特征向量。
使用上面给出的公式,我们将为每个 λi 值计算对应的特征向量 xi。
在\ \lambda = 1 时 \\ [A – (1)I]X1 = 0 \\ \implies \begin{bmatrix} 1-1 & 0 & -1\\1 & 2-1 & 1\\2 & 2 & 3-1 \end{bmatrix} \begin{bmatrix} x1\\x2\\x3 \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \\ 0 \end{bmatrix} \\ \implies \begin{bmatrix} 0 & 0 & -1\\1 & 1 & 1\\2 & 2 & 2 \end{bmatrix} \begin{bmatrix} x1\\x2\\x3 \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \\ 0 \end{bmatrix} \\ 求解后\ 我们\ 得到\ 以下\ 方程: \\ x3 = 0 (x1) \\ x1 + x2 = 0 \implies x2 = -x1 \\ \therefore X1 = \begin{bmatrix} x1\\-x1\\ 0(x1) \end{bmatrix} \\ \implies X1 = \begin{bmatrix} 1\\-1\\0 \end{bmatrix}
同理, \\ 对于\ \lambda = 2 \\ X2 = \begin{bmatrix} -2\\1\\2 \end{bmatrix} \\ 以及 \\ 对于\ \lambda = 3 \\ X3 = \begin{bmatrix} 1\\-1\\-2 \end{bmatrix}
因此,我们获得了对应于每个 λ 值的特征向量 X1、X2、X3。
矩阵的秩:
(m x n) 矩阵的秩由矩阵中存在的线性无关行的数量决定。考虑下面给出的示例以便更好地理解。
A = \begin{bmatrix} 1 & 0 & 0\\0 & 1 & 0\\0 & 0 & 1 \end{bmatrix}
矩阵 A 的所有 3 行都是线性无关的。因此,秩 ( A ) = 3。
B = \begin{bmatrix} 2 & 1 & 3\\3 & 2 & 0\\5 & 3 & 3 \end{bmatrix} \\
秩 ( B ) = 2。 这是因为第 3 行依赖于 R1 和 R2。[R3 <- R1 + R2]
一些重要性质:
对于任何形状为 m x n 的矩阵 A,以下秩性质适用:
- 秩 (A) = 秩 (A^T)
- 秩 (BAC) = 秩 (A),前提是 B 和 C 是可逆矩阵。
- 秩 (AB) ≤ min{ 秩 (A) + 秩 (B) }
在进入低秩近似之前,理解以下内容很重要:
- 矩阵分解
任何形状为 m x n 且秩为 r 的矩阵 A,当它采用以下形式时,被称为已分解:
A = BC^T
where, the shapes of the matrices are:
mat(A) -> m x n
mat(B) -> m x r
mat(C) -> n x r
- 低秩