特征向量计算与低秩近似

前置知识: 特征值与特征向量

在深入探讨特征向量计算背后的数学原理之前,让我们先简要讨论一下特征值和特征向量到底是什么。

特征值与特征向量:

单词 ‘eigen‘ 意味着 ‘特征‘。一般来说,特征值和特征向量 描述了矩阵或向量的特征。

特征向量:这是一个由矩阵 X 表示的向量,使得当 X 与任意矩阵 A 相乘时,结果矩阵的方向与向量 X 保持一致。请仔细观察 图 1,查看特征向量的图形表示。

!image图 1:特征向量表示

在图 1 中,我们观察到以下标量变换:

\vec{v1‘} = 1.5 (\vec{v1}) \\ \vec{v2‘} = 0.5 (\vec{v2})

应用这些变换后,向量 v1‘ 和 v2‘ 的方向与 v1 和 v2 相同。因此根据我们的定义,这些向量被认为是特征向量。但是结果向量 v3‘ 的方向与 v3 不同。因此它不能被视为特征向量。

特征值: 它告诉我们特征向量被拉伸或缩小的程度。

在上述情况下,特征值将是 1.50.5

计算特征向量

我们可以使用矩阵的特征方程来计算任何矩阵的特征值(正如前置知识文章中所讨论的),即:

A – \lambda I

= 0

上述方程的根(即 λ 的值)给出了我们特征值。

利用获得的 λ 值,我们可以使用下面给出的方程找到对应的特征向量。

在\ \lambda=i时\\ [A-iI ]X_i = 0

示例问题

考虑以下示例以便更好地理解。假设有一个定义的 3×3 矩阵 X:

A = \begin{bmatrix}     1 & 0 & -1\\1 & 2 & 1\\2 & 2 & 3 \end{bmatrix}

求对应于矩阵 A 的特征值和特征向量。

解决方案

1. 寻找特征值。

\\ det(A-\lambda I) = det(\begin{bmatrix}     1-\lambda & 0 & -1\\1 & 2-\lambda & 1\\2 & 2 & 3-\lambda \end{bmatrix}) = 0 \\ \implies (\lambda^3 – 6\lambda^2 +11\lambda -6) = 0 \\ \implies (\lambda – 1)( \lambda – 2)(\lambda -3) = 0 \\ \implies \lambda = 1,2,3

因此,获得的特征值为 1、2 和 3。

2. 寻找特征向量。

使用上面给出的公式,我们将为每个 λi 值计算对应的特征向量 xi。

在\ \lambda = 1 时 \\ [A – (1)I]X1 = 0 \\ \implies \begin{bmatrix}   1-1  & 0 & -1\\1 & 2-1 & 1\\2 & 2 & 3-1 \end{bmatrix} \begin{bmatrix}   x1\\x2\\x3 \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \\ 0 \end{bmatrix} \\ \implies \begin{bmatrix}     0 & 0 & -1\\1 & 1 & 1\\2 & 2 & 2 \end{bmatrix} \begin{bmatrix}     x1\\x2\\x3 \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \\ 0 \end{bmatrix} \\ 求解后\ 我们\ 得到\ 以下\ 方程: \\ x3 = 0 (x1) \\ x1 + x2 = 0 \implies x2 = -x1  \\ \therefore X1 = \begin{bmatrix}   x1\\-x1\\ 0(x1) \end{bmatrix} \\ \implies X1 = \begin{bmatrix}   1\\-1\\0 \end{bmatrix}

同理, \\ 对于\ \lambda = 2 \\ X2 = \begin{bmatrix}   -2\\1\\2 \end{bmatrix} \\ 以及 \\ 对于\ \lambda = 3 \\ X3 = \begin{bmatrix}   1\\-1\\-2 \end{bmatrix}

因此,我们获得了对应于每个 λ 值的特征向量 X1、X2、X3。

矩阵的秩:

(m x n) 矩阵的秩由矩阵中存在的线性无关行的数量决定。考虑下面给出的示例以便更好地理解。

A = \begin{bmatrix}     1 & 0 & 0\\0 & 1 & 0\\0 & 0 & 1 \end{bmatrix}

矩阵 A 的所有 3 行都是线性无关的。因此,秩 ( A ) = 3

B = \begin{bmatrix}     2 & 1 & 3\\3 & 2 & 0\\5 & 3 & 3 \end{bmatrix} \\

秩 ( B ) = 2。 这是因为第 3 行依赖于 R1 和 R2。[R3 <- R1 + R2]

一些重要性质:

对于任何形状为 m x n 的矩阵 A,以下秩性质适用:

  • 秩 (A) = 秩 (A^T)
  • 秩 (BAC) = 秩 (A),前提是 B 和 C 是可逆矩阵。
  • 秩 (AB) ≤ min{ 秩 (A) + 秩 (B) }

在进入低秩近似之前,理解以下内容很重要:

  • 矩阵分解

任何形状为 m x n 且秩为 r 的矩阵 A,当它采用以下形式时,被称为已分解:

A = BC^T

where, the shapes of the matrices are:
 
mat(A) -> m x n
mat(B) -> m x r 
mat(C) -> n x r
  • 低秩
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。如需转载,请注明文章出处豆丁博客和来源网址。https://shluqu.cn/34592.html
点赞
0.00 平均评分 (0% 分数) - 0