线性映射是一种数学运算,它使用线性函数将一组输入值转换为一组输出值。它通常被用作预处理步骤,将输入数据转换为更适合分析的格式。它也可以本身作为一个模型,例如在线性回归或线性分类器中。
线性映射函数可以表示如下
> y = Wx +b
其中
- x 是输入向量,
- W 是权重矩阵
- b 是偏置向量
- y 是输出向量。
权重矩阵和偏置向量是在训练过程中学习得到的。
设 V 和 W 是域 K 上的向量空间。如果对于任意向量 u, v ∈ V 和标量 c ∈ K,满足以下条件,则函数 f: V -> W 被称为线性映射:
- 如果变换本质上是可加的:
> f ( u + v ) = f ( u ) + f ( v )
- 如果变换是齐次的:
> f ( c . u ) = c . f ( u )
零变换/恒等变换
从向量空间到其自身的线性变换 T: V \rightarrow V 称为线性算子:
零变换:对于变换 T: V \rightarrow W,如果满足以下条件,则称为零变换:
> T ( v ) = 0 \forall V
恒等变换:对于变换 T: V \rightarrow V,如果满足以下条件,则称为恒等变换:
> T ( v ) = v \, \forall \, V
线性变换的性质
设 T: V \rightarrow W 为线性变换,其中 u, v \epsilon V。那么,以下性质成立:
- T(0) =0
- T ( -v ) = -T ( v )
- T ( u – v ) = T( u ) – T( v )
如果 v = c1 v1 + c2 v2 + … + cn vn
那么,T(v) = c1 T(v1) + c2 T(v2) + … + cn T(vn)
矩阵的线性变换
设 T 是一个 mxn 矩阵,变换 T: R^n \rightarrow R^m 是线性变换,如果:
> T(v) = Av
零矩阵和单位矩阵运算
- 一个 mxn 矩阵是零矩阵,对应于从 R^n \rightarrow R^m 的零变换。
- 一个 nxn 矩阵是单位矩阵 \mathbb{I_n},对应于从 R^n \rightarrow R^m 的零变换。
A \cdot R^m = R^n \\ \begin{bmatrix} a{11}& a{12}& .& .& .& a{1n} \\ a{21}& a{22}& .& .& .&a{2n} \\ .& .& .& & & .\\ .& .& & .& & .\\ .& .& & & .& .\\ a{m1}& a{m2}& .& .& .&a{mn} \end{bmatrix} \cdot \begin{bmatrix} v1\\ v2\\ .\\ .\\ .\\ vn \end{bmatrix} = \begin{bmatrix} a{11} v1 + a{12} v2 \,.\, \, . a{1n} vn \\ .\\ .\\ .\\ .\\ a{m1} v1 + a{m2} v2 \,.\, \, . a{mn} vn \\ \end{bmatrix}
示例
让我们考虑从 R^{2} \rightarrow R^3 的线性变换,使得:
L(\begin{bmatrix} v1\\ v2 \end{bmatrix})= \begin{bmatrix} v2\\ v1 – v2 \\ v1 + v_2 \end{bmatrix}
现在,我们将验证它是一个线性变换。为此,我们需要检查上述线性映射的两个条件,首先,我们将检查常数乘法条件:
> L(c \vec{v}) = c \cdot L(\vec{v})
>
> L(c\begin{bmatrix} v1\\ v2 \end{bmatrix})= \begin{bmatrix} c v1\\ c v1 – c v2 \\ c v1 + c v2 \end{bmatrix}= c \begin{bmatrix} v1\\ v1 – v2 \\ v1 + v2 \end{bmatrix} = c L(\vec{v})
以及以下变换:
> L(\vec{v} + \vec{w})= L(\vec{v}) + L(\vec{w})
>
> \vec{v} =\begin{bmatrix} v1 \\ v2 \end{bmatrix} \\\vec{w} =\begin{bmatrix} w1 \\ w2 \end{bmatrix} \\\\vec{v} + \vec{w} =\begin{bmatrix} v1 + w1\\ v2 + w2 \end{bmatrix}
>
> L(\vec{v} + \vec{w}) = \begin{bmatrix} v1 + w1\\ (v1 + w1) – (v2 + w2)\\ (v1 + w1) + (v2 + w2) \end{bmatrix}
>
> = L(\vec{v}) + L(\vec{w})
这证明了上述变换是线性变换。
非线性变换的例子包括三角变换、多项式变换。
核空间和值域空间
!kernel核空间和值域空间
设 T: V \rightarrow W 是线性变换,那么 \forall v \epsilon V 使得:T \cdot v =0 是 T 的核空间。它也被称为 T 的零空间。
- T:V \rightarrow W 的零变换的核空间是 W。
- T:V \rightarrow W 的恒等变换的核空间是 {0}。
核空间的维数被称为零度或 null(T)。
值域空间
设 T: V \rightarrow W 是线性变换,那么 \forall v \epsilon V 使得:T \cdot v = v 是 T 的值域空间。对于矩阵上的线性变换,值域空间始终是一个非空集,因为:T \cdot 0 =0
值域空间的维数被称为秩。