线性映射详解

线性映射是一种数学运算,它使用线性函数将一组输入值转换为一组输出值。它通常被用作预处理步骤,将输入数据转换为更适合分析的格式。它也可以本身作为一个模型,例如在线性回归或线性分类器中。

线性映射函数可以表示如下

> y = Wx +b

其中

  • x 是输入向量,
  • W 是权重矩阵
  • b 是偏置向量
  • y 是输出向量。

权重矩阵和偏置向量是在训练过程中学习得到的。

设 V 和 W 是域 K 上的向量空间。如果对于任意向量 u, v ∈ V 和标量 c ∈ K,满足以下条件,则函数 f: V -> W 被称为线性映射:

  • 如果变换本质上是可加的:

> f ( u + v ) = f ( u ) + f ( v )

  • 如果变换是齐次的:

> f ( c . u ) = c . f ( u )

零变换/恒等变换

从向量空间到其自身的线性变换 T: V \rightarrow V 称为线性算子:

零变换:对于变换 T: V \rightarrow W,如果满足以下条件,则称为零变换:

> T ( v ) = 0 \forall V

恒等变换:对于变换 T: V \rightarrow V,如果满足以下条件,则称为恒等变换:

> T ( v ) = v \, \forall \, V

线性变换的性质

设 T: V \rightarrow W 为线性变换,其中 u, v \epsilon V。那么,以下性质成立:

  • T(0) =0
  • T ( -v ) = -T ( v )
  • T ( u – v ) = T( u ) – T( v )

如果 v = c1 v1 + c2 v2 + … + cn vn

那么,T(v) = c1 T(v1) + c2 T(v2) + … + cn T(vn)

矩阵的线性变换

设 T 是一个 mxn 矩阵,变换 T: R^n \rightarrow R^m 是线性变换,如果:

> T(v) = Av

零矩阵和单位矩阵运算

  • 一个 mxn 矩阵是零矩阵,对应于从 R^n \rightarrow R^m 的零变换。
  • 一个 nxn 矩阵是单位矩阵 \mathbb{I_n},对应于从 R^n \rightarrow R^m 的零变换。

A \cdot R^m = R^n \\ \begin{bmatrix} a{11}& a{12}& .& .& .& a{1n} \\ a{21}& a{22}& .& .& .&a{2n} \\ .& .& .& & & .\\ .& .& & .& & .\\ .& .& & & .& .\\ a{m1}& a{m2}& .& .& .&a{mn} \end{bmatrix} \cdot \begin{bmatrix} v1\\ v2\\ .\\ .\\ .\\ vn \end{bmatrix} = \begin{bmatrix} a{11} v1 + a{12} v2 \,.\, \, . a{1n} vn \\ .\\ .\\ .\\ .\\ a{m1} v1 + a{m2} v2 \,.\, \, . a{mn} vn \\ \end{bmatrix}

示例

让我们考虑从 R^{2} \rightarrow R^3 的线性变换,使得:

L(\begin{bmatrix} v1\\ v2 \end{bmatrix})= \begin{bmatrix} v2\\ v1 – v2 \\ v1 + v_2 \end{bmatrix}

现在,我们将验证它是一个线性变换。为此,我们需要检查上述线性映射的两个条件,首先,我们将检查常数乘法条件:

> L(c \vec{v}) = c \cdot L(\vec{v})

>

> L(c\begin{bmatrix} v1\\ v2 \end{bmatrix})= \begin{bmatrix} c v1\\ c v1 – c v2 \\ c v1 + c v2 \end{bmatrix}= c \begin{bmatrix} v1\\ v1 – v2 \\ v1 + v2 \end{bmatrix} = c L(\vec{v})

以及以下变换:

> L(\vec{v} + \vec{w})= L(\vec{v}) + L(\vec{w})

>

> \vec{v} =\begin{bmatrix} v1 \\ v2 \end{bmatrix} \\\vec{w} =\begin{bmatrix} w1 \\ w2 \end{bmatrix} \\\\vec{v} + \vec{w} =\begin{bmatrix} v1 + w1\\ v2 + w2 \end{bmatrix}

>

> L(\vec{v} + \vec{w}) = \begin{bmatrix} v1 + w1\\ (v1 + w1) – (v2 + w2)\\ (v1 + w1) + (v2 + w2) \end{bmatrix}

>

> = L(\vec{v}) + L(\vec{w})

这证明了上述变换是线性变换。

非线性变换的例子包括三角变换、多项式变换。

核空间和值域空间

!kernel核空间和值域空间

设 T: V \rightarrow W 是线性变换,那么 \forall v \epsilon V 使得:T \cdot v =0 是 T 的核空间。它也被称为 T 的零空间

  • T:V \rightarrow W 的零变换的核空间是 W。
  • T:V \rightarrow W 的恒等变换的核空间是 {0}。

核空间的维数被称为零度或 null(T)。

值域空间

设 T: V \rightarrow W 是线性变换,那么 \forall v \epsilon V 使得:T \cdot v = v 是 T 的值域空间。对于矩阵上的线性变换,值域空间始终是一个非空集,因为:T \cdot 0 =0

值域空间的维数被称为秩。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。如需转载,请注明文章出处豆丁博客和来源网址。https://shluqu.cn/53030.html
点赞
0.00 平均评分 (0% 分数) - 0