线性空间与线性变换

我的原文地址
第四章：线性空间与线性变换 1. 引言第二章引进了向量空间与矩阵的概念，并阐明了它们在代数学上的地位：向量空间是一个最初等的代数系统，矩阵则代表 $K^n$ 到 $K^m$ 的一个保持加法、数乘运算的映射.这样，就摆脱了数及其四则运算的局限性，进入了一类不是由普通的数所构成的集合，在这个集合内研究不是普通数的运算的两种新的运算.但是这个转变还处在一个比较低的层次上.因为，向量空间中的元素虽然不是普通的数，却仍局限于多元有序数组，就是说只是从研究单个的数进到研究一组数.一说“向量”，就意味着一组具体的数，一说“加法”就是具体的分量相加，数乘就是数乘每个分量.如果仍停留在这个水平上，认识就还没提升到应有的高度.要从感性上升到理性，从具体上升到抽象，才会有理论上的实质进展，对该理论的认识才能深入，该领域的应用范围才能更加宽广.因此，关于向量空间和矩阵的认识还需要从理论上在提高一步.可以发觉，前面关于向量空间的概念及有关定理、它们的证明都不依赖于有序数组的具体表达式、加法和数乘的具体计算式.而只依赖于：向量间有加法、数乘，且满足八条运算法则.从中可以获得启发：可以把多元数组这一具体表达形式与加法、数乘的具体计算式这些非本质的东西抛弃，只把最根本的八条运算法则保留下来，当作“公理”加以承认.这样就形成了本章的核心概念，也是线性代数的基本研究对象：线性空间.

矩阵是向量空间之间保持加法数乘运算的映射，现在已经把向量空间提升为抽象的线性空间，那么矩阵也相应地被提升为线性空间之间保持向量加法、数乘的映射，及线性空间之间的线性映射，特别是一个线性空间到自身的线性变换.这是本章的第二个核心概念.

Contents
Contents
1.  引言
2.  总括
3.  线性空间的基本概念
   3.1.  线性空间的定义
   3.2.  线性空间的基本属性
   3.3.  基和维数
   3.4.  向量的坐标
   3.5.  基变换与坐标变换
     3.5.1.  线性空间中的基变换
     3.5.2.  线性空间中的坐标变换
4.  子空间与商空间
   4.1.  子空间的基本概念
   4.2.  子空间的交与和
   4.3.  子空间的直和
   4.4.  商空间
5.  线性映射与线性变换
   5.1.  线性映射
   5.2.  线性空间的同构
   5.3.  线性映射的核、像集、余核
   5.4.  线性映射的矩阵
   5.5.  线性变换的基本概念
   5.6.  线性变换在不同基下的矩阵
6.  线性变换的特征值与特征向量
   6.1.  特征值与特征向量的定义
   6.2.  特征多项式的基本性质
   6.3.  具有对角形矩阵的线性变换
   6.4.  不变子空间
   6.5.  商空间中的诱导变换

2. 总括线性代数的核心内容是研究线性空间和它们之间的线性映射，特别是线性空间自身的线性变换的理论.线性空间是一种最初等、最基本的代数系统，但在它的基本理论中充分体现了代数学的基本思想与基本方法.下面几个方面值得注意：

线性空间的运算是以抽象形式出现的，线性空间的全部理论则以这些运算满足的八条（实际上是七条）公理为立足点.它用这概括了相当广泛的一类客观事物的共性，因而又具有广泛的应用领域.这一特点是代数学各分支共有的.
研究线性空间的基本方法有两种，一是进行空间分解，研究各种子空间，二是从总体上提升一步研究商空间.这是研究各种代数系统共通的方法.
抽象与具体紧密结合，先从线性方程组入手形成向量空间和矩阵，再舍弃其具体的躯壳形成线性空间和线性变换的一般理论，从而能站在更高的理论层次上将问题看得更深更透，而且更直观.所以，当从理论上处理问题时，从线性空间和线性变换的观点来处理较为合适.而当需要做具体计算时，又要把抽象问题在具体化.从具体到抽象，又从抽象回到具体，也是代数学各领域普遍适用的方法.
线性空间虽为最简单的代数系统，又有其它代数系统一般不具备的特殊性质，就是有线性相关与线性无关的概念，有它产生了基和维数这一核心概念.它使我们有可能把对线性空间中无限多向量的研究归结为有限多个向量（一组基）的研究.吧线性映射（变换）归结为一组基处的作用，从而与矩阵建立起紧密的联系.从中再引导出基变换关系及矩阵的相似关系，后者又产生出特征值、特征向量这一重要理论.

3. 线性空间的基本概念 3.1. 线性空间的定义

Definition 1.

V

是一非空集合，

K

是一数域，又设：

(i)在 $V$ 中定义了一种运算，称为加法.即对任意 $\alpha,\, \beta\in V$ ，都按某一法则对应于 $V$ 内唯一确定的一个元素，记为 $\alpha+\beta$ ；

(ii)在 $K$ 中的数与 $V$ 中的元素间定义了一种运算，称为数乘.即对任意 $k\in K,\, \alpha\in V$ ，都按某一法则对应于 $V$ 内唯一确定的一个元素，记之为 $k\alpha$ .

则称 $V$ 是 $K$ 上的线性空间，如果加法与数乘满足如下八条运算法则：

$\forall\, \alpha,\beta,\gamma\in V,\, \alpha+(\beta+\gamma)=(\alpha+\beta)+\gamma$ ；
$\forall\, \alpha,\beta\in V,\, \alpha+\beta=\beta+\alpha$ ；
$\exists\, 0\in V,\, \mathrm{s.t.}\forall\, \alpha\in V,\, \alpha+0=\alpha$ ；
$\forall\, \alpha\in V,\, \exists\, \beta\in V,\, \mathrm{s.t.}\, \alpha+\beta=0$ ；
$1\cdot\alpha=\alpha$ ；
$\forall\, k,l\in K,\alpha\in V,\, (kl)\alpha=k(l\alpha)$ ；
$\forall\, k,l\in K,\alpha\in V,\, (k+l)\alpha=k\alpha+l\alpha$ ；
$\forall\, k\in K,\alpha,\beta\in V,\, k(\alpha+\beta)=k\alpha+k\beta$ .

事实上，在定义中加法交换律是多余的（但为了叙述简洁，一般把它当做公理列入），因为它可以由其它七条推出：

先证 $0\alpha=0$ .设 $0\alpha+\beta=0$ .
\begin{align*}
0\alpha= & 0\alpha+0=0\alpha+(0\alpha+\beta)=(0\alpha+0\alpha)+\beta \\
& =(0+0)\alpha+\beta=0\alpha+\beta=0.
\end{align*}

再证 $\alpha+(-1)\alpha=0.\, \alpha+(-1)\alpha=1\cdot\alpha+(-1)\alpha=0\alpha=0$ .

再证 $\alpha+\beta=0\Rightarrow\beta+\alpha=0$ .设 $\beta+\gamma=0$ .
\begin{align*}
\beta+\alpha & =(\beta+\alpha)+0=(\beta+\alpha)+(\beta+\gamma)=((\beta+\alpha)+\beta)+\gamma \\
& =(\beta+(\alpha+\beta))+\gamma=(\beta+0)+\gamma=\beta+\gamma=0.
\end{align*}

再证 $0+\alpha=\alpha$ .设 $\alpha+\beta=0$ ，则 $\beta+\alpha=0.\, 0+\alpha=(\alpha+\beta)+\alpha=\alpha+(\beta+\alpha)=\alpha+0=0$ .

设 $\alpha+\beta=0$ ，
\begin{align*}
\beta+\alpha & =0+(\beta+\alpha)=((\alpha+\beta)+(-1)(\alpha+\beta))+(\beta+\alpha) \\
& =(\alpha+\beta)+((-1)\alpha+(-1)\beta)+(\beta+\alpha)=(\alpha+\beta)+((-1)\alpha+((-1)\beta+\beta)+\alpha)\\
& =(\alpha+\beta)+((-1)\alpha+0+\alpha)=(\alpha+\beta)+((-1)\alpha+\alpha)=(\alpha+\beta)+0=\alpha+\beta.\\
\end{align*}
3.2. 线性空间的基本属性 $V$ 内的加法和数乘都是以抽象的形式给出来的，可能跟熟悉的数或向量空间中的向量的加法和数乘相去甚远，因此一些习以为常的事实，都需要从逻辑上加以证明以确认其正确性.

零向量唯一.
负向量唯一.
加法有消去率.
加法可移项.
$0\cdot\alpha=0;\, (-1)\alpha=-\alpha;\, k\cdot0=0.$
$k\alpha=0,\, k\neq0\Longrightarrow\alpha=\dfrac1k\beta.$

3.3. 基和维数

Theorem 2.

n

维线性空间中，

任意 $n$ 个线性无关向量都是它的一组基；
它的任意一组基一定恰好含 $n$ 个向量.

Corollary 3.

n

维线性空间

V=L(\alpha_1,\alpha_2,\dots,\alpha_n)

，则

\alpha_1,\alpha_2,\dots,\alpha_n

是一组基.

在 $n$ 维线性空间中，任意 $n+1$ 个向量都是线性相关的，所以最多只有 $n$ 个线性无关的向量.

证：任意 $n$ 个线性无关向量，加上 $V$ 任意一个向量后有 $n+1$ 个向量，能被 $n$ 个向量的向量组表示，由定理theorem213，它们线性相关，故后加的向量能被原给的 $n$ 个线性无关向量线性表示，故这 $n$ 个线性无关向量构成一组基.

任意一组基，它与含 $n$ 个向量的基等价，由theorem214，二者秩相等，又都线性无关，故都含 $n$ 个向量.
3.4. 向量的坐标设 $\alpha,\beta$ 在一组取定的基下的坐标表示式为
\begin{gather*}
\alpha=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)\begin{bmatrix}
a_1\\a_2\\ \vdots\\a_n
\end{bmatrix},\beta=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)\begin{bmatrix}
b_1\\b_2\\ \vdots\\b_n
\end{bmatrix}. \\
\Longrightarrow\alpha+\beta=(a_1+b_1)\varepsilon_1+\dots+(a_n+b_n)\varepsilon_n=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)\begin{bmatrix}
a_1+b_1\\a_2+b_2\\ \vdots\\a_n+b_n
\end{bmatrix}.\\
k\alpha=ka_1\alpha_1+ka_2\alpha_2+\dots+ka_n\alpha_n=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)\begin{bmatrix}
ka_1\\ka_2\\ \vdots\\ka_n
\end{bmatrix}.
\end{gather*}

$\alpha$ 的坐标可看作 $K^n$ 中一个向量， $V$ 中两个向量相加对应于它们在 $K^n$ 中的坐标相加， $V$ 中向量的数乘对应于它们在 $K^n$ 中的坐标向量作数乘.这样就把 $V$ 中向量的抽象加法、数乘运算具体化为它们的坐标作为 $K^n$ 中向量按 $K^n$ 具体的向量加法、数乘作运算.这就是说，在 $V$ 中取定一组基后，又把抽象还原为了具体.

Theorem 4.

\alpha_i=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)A_i

，则

\alpha_1,\alpha_2,\dots,\alpha_s

线性相关的充要条件是

A_1,A_2,\dots,A_s

线性相关.

3.5. 基变换与坐标变换

显然有一个问题需要解决：

3.5.1. 线性空间中的基变换

给定两组基 $\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n;\, \eta_1,\eta_2,\dots,\eta_n$ .基变换公式：
\[(\eta_1,\eta_2,\dots,\eta_n)=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)T.\]

Definition 5. 称

T

为从基

\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n

到基

\eta_1,\eta_2,\dots,\eta_n

的过渡矩阵，如果
\begin{gather*}
(\eta_1,\eta_2,\dots,\eta_n)=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)T, \
T=\begin{bmatrix}
t_{11}&t_{12}&\cdots&t_{1n}\\
t_{21}&t_{22}&\cdots&t_{2n}\\
\vdots&\vdots& &\vdots\\
t_{n1}&t_{n2}&\cdots&t_{nn}
\end{bmatrix}.
\end{gather*}

Theorem 6. 给定一组基

\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n

，令

(\eta_1,\eta_2,\dots,\eta_n)=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)T

, 则有：
\[\eta_1,\eta_2,\dots,\eta_n\, \text{是一组基}\Longleftrightarrow T\, \text{可逆}.\]

两组基间的过渡矩阵可逆，反过来从给定的一组基出发借助某一可逆矩阵就可获得一组新的基.

证：设 $T$ 列向量组为 $T_1,T_2,\dots T_n.\, \eta_1,\eta_2,\dots,\eta_n$ 是一组基的充要条件是 $\eta_1,\eta_2,\dots,\eta_n$ 线性无关，由theorem412，这等价于 $T_1,T_2,\dots T_n$ 线性无关等价于 $T$ 满秩或可逆.
3.5.2. 线性空间中的坐标变换令 $\alpha=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)X=(\eta_1,\eta_2,\dots,\eta_n)Y$ ，坐标变换公式：
\[X=TY.\]

这是因为 $\alpha=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)X=[(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)T]Y= (\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)(TY)$ .
4. 子空间与商空间下面主要从两个方面把对线性空间的研讨深入下去.第一方面，是深入探讨其内部结构，即下面阐述的子空间.另一方面，为从整体上更清晰地俯瞰一个线性空间的总体情况，又常常需要隐去其内部细节，就形成商空间的概念.这两种深入研究线性空间的方法，是代数学各领域所普遍使用的.
4.1. 子空间的基本概念

Theorem 7. 线性空间的一个非空子集是一个子空间的充分必要条件是，它对加法、数乘都封闭.

Theorem 8. 非零子空间内任一组基都可以扩充成

V

的一组基.

对定理theorem421，只要推出零向量仍属于 $M$ ， $M$ 内向量的负元素也仍在 $M$ 中，那么线性空间定义的八条性质就都具备.这是显然的：乘法封闭有 $0\alpha=0\in M,\, (-1)\alpha=-\alpha\in M$ .

对定理theorem422， $M$ 显然是有限维的，设 $\dim M=r$ ，一组基为 $\varepsilon_1,\dots,\varepsilon_r$ ，则 $M=L(\varepsilon_1,\dots,\varepsilon_r)$ .如果 $M=V$ ，则已有 $V$ 的基.如果 $M\neq V$ ，则存在 $\varepsilon_{r+1}\in V\backslash M$ ，可以证明 $\varepsilon_1,\dots,\varepsilon_r,\varepsilon_{r+1}$ 线性无关.如果 $L(\varepsilon_1,\dots,\varepsilon_r,\varepsilon_{r+1})\neq V$ ，继续上述步骤，经 $n-r$ 次步骤，得到 $n$ 个线性无关的向量，由定理theorem411，它们组成一组基.
4.2. 子空间的交与和子空间 $M_1,M_2$ 都含 $0$ ，故显然有 $M_1,M_2\subseteq M_1+M_2$ .值得注意的是一般情况下 $M_1+M_2\neq M_1\cup M_2$ .

Theorem 9. 子空间的交与和都仍是子空间.

Theorem 10 (维数公式). \[\dim(M_1+M_2)=\dim M_1+\dim M_2-\dim M_1\cap M_2.\]

Corollary 11.

\dim(M_1+\dots+M_k)\leqslant \dim M_1+\dots+\dim M_k

证：下面对维数公式进行推导.

取 $M_1\cap M_2$ 的一组基 $\varepsilon_1,\dots,\varepsilon_r$ .它可以扩充成 $M_1$ 的一组基 $\varepsilon_1,\dots,\varepsilon_r,\alpha_1,\dots,\alpha_s$ ，也可以扩充成 $M_2$ 的一组基 $\varepsilon_1,\dots,\varepsilon_r,\beta_1,\dots,\beta_t$ .只需证明 $\varepsilon_1,\dots,\varepsilon_r,\alpha_1,\dots,\alpha_s,\beta_1,\dots,\beta_t$ 是 $M_1+M_2$ 的一组基.

显然 $\alpha\in M_1+M_2$ 可被上述向量组线性表示，只需证其线性无关.设
\[k_1\varepsilon_1+\dots+k_r\varepsilon_r+a_1\alpha_1+\dots+a_s\alpha_s+b_1\beta_1+\dots+b_t\beta_t=0.\]
这可写成
\[\gamma=k_1\varepsilon_1+\dots+k_r\varepsilon_r+a_1\alpha_1+\dots+a_s\alpha_s=-(b_1\beta_1+\dots+b_t\beta_t).\]
故 $\gamma\in M_1\cap M_2$ ，可被 $\varepsilon_1,\dots,\varepsilon_r$ 线性表示：
\begin{gather*}
\gamma=c_1\varepsilon_1+\dots+c_r\varepsilon_r=-(b_1\beta_1+\dots+b_t\beta_t) \
\begin{split}
&\, c_1\varepsilon_1+\dots+c_r\varepsilon_r+b_1\beta_1+\dots+b_t\beta_t=0 \
\Longrightarrow&\, c_1=\dots=c_r=b_1=\dots=b_t=0.\
\Longrightarrow&\, k_1\varepsilon_1+\dots+k_r\varepsilon_r+a_1\alpha_1+\dots+a_s\alpha_s=0\
\Longrightarrow&\, k_1=\dots=k_r=a_1=\dots=a_s=b_1=\dots=b_t=0.
\end{split}
\end{gather*}

Proposition 12. 若

V

是非零空间，则它不能被它的任意多个有限子空间不能填满，即

M_1,M_2,\dots,M_s\neq V

这说明了和子空间的和相比，子空间的并的局限性，真子空间的和完全有可能等
于 $V$ .

证：下面分两种情况.若 $V$ 为有限维，设维数为 $n$ ，令
$\alpha_i=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)(1,i,\dots,i^{n-1})^{\mathrm{T}}$ ,
由范德蒙行列式知诸 $\alpha_i$ 任选 $n$ 个的坐标都线性无关，由定理
theorem412，这 $n$ 个向量线性无关，于是它们构成 $V$ 的一组基，因此每
个 $M_i$ 中至多包含 $n-1$ 个向量，故必有一个 $\alpha_i$ 不包含在 $M_i$ 中.

对一般情况，只需找到 $V$ 中一个向量不包含在任一 $M_i$ 中.对 $s$ 作归纳法. $\, s=1$ 时显然.现设 $s=m$ 时成立，对 $s=m+1$ ，取 $\alpha\notin M_1\cup M_2\cup\dots\cup M_m$ ，若 $\alpha\in M_{m+1}$ ，则已找出.若 $\alpha\in M_{m+1}$ ，取 $\beta\notin M_1\cup M_2\cup\dots\cup M_m$ ，若 $\beta\in M_{1}$ ，则已找出.若 $\beta\notin M_1$ ，考察 $\alpha,\beta$ 的线性组合，显
然其线性组合（系数不为零）不属于 $M_1$ 或 $M_{m+1}$ ，我们找出一种线性组合使其也不属于
$M_2,\dots,M_m$ ，将线性组合“标准化”为 $\alpha+k\beta(k\neq0)$ ，若
$\alpha+k\beta,\alpha+l\beta\in M_i\Rightarrow(k-l)\beta\in M_i\Rightarrow k=l$ ，故至多有一个 $k_i$ 使 $\alpha+k_i\beta\in M_i$ ，而
$K$ 内包含无穷多个数，故必存在 $K$ 内非零数 $k$ 使 $\alpha+k\beta\notin M_1,M_2,\dots,M_{m+1}$ ，即证.

对一般的证明，主要使用线性空间的基本性质构造出所需要的向量，其中主要是
依赖于数域内包含无穷多个数这个事实，如无此事实，则结论不成立.
4.3. 子空间的直和

Theorem 13. \begin{align*}
&\, M_1+M_2\, \text{是直和} \\
\Longleftrightarrow &\, 0\, \text{向量表法唯一}\\
\Longleftrightarrow &\, M_1\cap M_2=\{0\}\\
\Longleftrightarrow &\, \dim M_1+\dim M_2=\dim(M_1+M_2).
\end{align*}

Theorem 14. \begin{align*}
&\, M_1+M_2+\dots+M_k\, \text{是直和} \\
\Longleftrightarrow &\, 0\, \text{向量表法唯一}\\
\Longleftrightarrow &\, M_i\cap \Big(\sum_{\substack{j=1\\j\neq i}}^k M_j\Big)=\{0\}\; (i\, \text{遍历}1\text{到}k)\\
\Longleftrightarrow &\, \dim\sum_{i=1}^k M_i=\sum_{i=1}^k \dim M_i.
\end{align*}

Corollary 15. \[V=M_1\oplus M_2\oplus\dots\oplus M_k.\]

在每个 $M_i$ 内取一组基，合并后得到 $V$ 的一组基.

Theorem 16.

M

是有限维线性空间

V

的子空间，则存在子空间

N

，使
\[V=M\oplus N.\]

对定理theorem425，双向证之.若 $M_1+M_2$ 是直和， $0$ 向量表法当然唯一，任取 $\beta\in M_1\cap M_2$ ，则 $0$ 可表为 $0=\beta+(-\beta)\Rightarrow \beta=0\Rightarrow M_1\cap M_2=\{0\}$ .反之若 $M_1\cap M_2=\{0\},\, \alpha=\alpha_1+\alpha_2=\alpha^\prime _1+\alpha^\prime _2\Rightarrow \alpha_1-\alpha^\prime _1=-(\alpha_2-\alpha^\prime _2)\in M_1\cap M_2=\{0\}\Rightarrow \alpha$ 表法唯一.

对定理theorem426，类似.若 $M_1+M_2+\dots+M_k$ 是直和， $0$ 向量表法当然唯一.设 $\beta,-\beta\in M_i\cap\bigl(\sum_{j\neq i}M_j\bigr)$ ，则
$0=\beta+(-\beta)=\alpha_1+\dots+\alpha_{i-1}+(-\beta)+\alpha_{i+1}+\dots+\alpha_k\Longrightarrow\beta=0\Longrightarrow$ 交集是零空间.
当 $k=2$ 时由维数公式，下面的命题成立：
\[M_i\cap \Big(\sum_{\substack{j=1\\j\neq i}}^k M_j\Big)=\{0\}\; (i\, \text{遍历}1\text{到}n)\Longrightarrow\dim\sum_{i=1}^k M_i=\sum_{i=1}^k \dim M_i.\]
设该命题对 $k-1$ 个子空间成立，对任一 $j\geqslant2$ ，
\[M_j\cap\Big(\sum_{\substack{s=2\\s\neq j}}^k M_s\Big)\subseteq M_j\cap\Big(\sum_{\substack{s=1\\s\neq j}}^k M_s\Big)=\{0\}\Longrightarrow\dim\sum_{j=2}^k M_j=\sum_{j=2}^k \dim M_j.\]
那么，
\[M_1\cap\Big(\sum_{j=2}^k M_j=\{0\}\Big)\Longrightarrow\dim\sum_{i=1}^k M_i=\dim M_1+\dim\sum_{j=2}^k M_j=\sum_{i=1}^k \dim M_i.\]

反过来，对任一 $i$ ，
\begin{align*}
& \dim\sum_{i=1}^k M_i=\sum_{i=1}^k \dim M_i \\
\Longrightarrow{} & \mathrel{\phantom{=}}\dim\biggl(M_i\cap\Bigl(\sum_{\substack{j=1\\j\neq i}}^k M_j\Bigr)\biggr)=\dim M_i+\dim\sum_{\substack{j=1\\j\neq i}}^k M_j-\dim\sum_{j=1}^k M_j\\
& \leqslant\dim M_i+\sum_{\substack{j=1\\j\neq i}}^k\dim M_j-\dim\sum_{j=1}^k M_j \\
& =\sum_{j=1}^k\dim M_j-\dim\sum_{j=1}^k M_j=0\\
\Longrightarrow{} & M_i\cap \Big(\sum_{\substack{j=1\\j\neq i}}^k M_j\Big)=\{0\}.
\end{align*}

下面证明任一 $\alpha\in\sum M_i$ 表法唯一.令 $\alpha=\alpha_1+\dots+\alpha_k=\alpha^\prime_1+\dots+\alpha^\prime_k$ .对任一 $i$ ，
\[\alpha_i-\alpha^\prime_i=(\alpha^\prime_1-\alpha_1)+\dots+(\alpha^\prime_{i-1}-\alpha_{i-1})+(\alpha^\prime_{i+1}-\alpha_{i+1})+\dots+(\alpha^\prime_k-\alpha_k)\in M_i\cap \Big(\sum_{\substack{j=1\\j\neq i}}^k M_j\Big)=\{0\}.\]

对于定理theorem427， $M=\{0\}$ 时取 $N=V$ .若 $M\neq\{0\}$ ，令
$M=L(\varepsilon_1,\dots,\varepsilon_r)$ ，这组基可扩充成 $V$ 的一组基
$\varepsilon_1,\dots,\varepsilon_r,\varepsilon_{r+1},\dots,\varepsilon_n$ .令
$N=L(\varepsilon_{r+1},\dots,\varepsilon_n)$ ，则 $V=M+N$ ，且 $\dim V=\dim M+\dim N$ ，故 $V=M\oplus N$ .

对定理theorem426，略作改进，可得到某些情况下用起来较方便的如下命题：

Proposition 17. \[M_1+M_2+\dots+M_k\, \text{是直和}\, \Longleftrightarrow M_i\cap \Big(\sum_{j=1}^{i-1} M_j\Big)=\{0\}\; (i\, \text{遍历}1\text{到}k).\]

必要性由定理theorem426显然成立，对充分性，若不是直和，则 $0$ 表法
不唯一，设 $0=\sum \alpha_{i}$ ，此时至少有两个不为 $0$ ，设自右至左第一个
非 $0$ 的是 $\alpha_i$ ，则 $i\geqslant2$ ，且
\[-\alpha_{i}=\alpha_1+\alpha_2+\dots+\alpha_{i-1}\in M_i\cap\Big(\sum_{j=1}^{i-1} M_j\Big)=\{0\}\Longrightarrow\alpha_i=0,\]
矛盾.
4.4. 商空间关于模 $M$ 的同余类有如下简单性质：

$\alpha^\prime \equiv\alpha\Longleftrightarrow\alpha^\prime -\alpha\in M\Longleftrightarrow\alpha^\prime \in \alpha+M\Longleftrightarrow\alpha^\prime +M=\alpha+M$ ;
$\alpha+M=0+M\Longleftrightarrow\alpha\in M$ ;
$\alpha^\prime +M\neq \alpha+M\Longrightarrow(\alpha^\prime +M)\cap(\alpha+M)=\varnothing$ .

可以证明若 $\alpha^\prime \in \alpha+M$ ，则 $\alpha^\prime +M\subseteq\alpha+M,\, \alpha+M\subseteq\alpha^\prime +M$ .若 $\alpha^\prime +M=\alpha+M$ ，取一元素 $\beta$ ，则 $\beta=\alpha^\prime +m_1=\alpha+m_2\Rightarrow\alpha^\prime =\alpha+(m_2-m_1)\Rightarrow\alpha^\prime \in \alpha+M$ .若存在 $\beta\in(\alpha^\prime +M)\cap(\alpha+M)$ ，有 $\alpha^\prime +M=\beta+M=\alpha+M$ .

Theorem 18. \[\dim V/M=\dim V-\dim M.\]

证：在 $M$ 内取一组基 $\varepsilon_1,\dots,\varepsilon_m$ ，扩充为 $V$ 的一组基 $\varepsilon_1,\dots,\varepsilon_n$ ，下证 $\overline{\varepsilon}_{m+1},\dots,\overline{\varepsilon}_n$ 是 $V/M$ 的一组基.

先证线性无关.
\begin{align*}
& k _ {m+1}\overline{\varepsilon} _ {m+1}+\dots+k _ n\overline{\varepsilon} _ n=\overline{0}. \\
\Longrightarrow{} & \overline{k _ {m+1}\varepsilon _ {m+1}+\dots+k _ n\varepsilon _ n}=\overline{0}=0+M\\
\Longrightarrow{} & k _ {m+1}\varepsilon _ {m+1}+\dots+k _ n\varepsilon _ n\in M\\
\Longrightarrow{} & k _ {m+1}\varepsilon _ {m+1}+\dots+k _ n\varepsilon _ n=k _ 1\varepsilon _ 1+\dots+k _ m\varepsilon _ m\\
\Longrightarrow{} & k _ {m+1}=\dots=k _ n=0.
\end{align*}

再证 $\overline{\alpha}$ 可被 $\overline{\varepsilon} _ {m+1},\dots,\overline{\varepsilon} _ n$ 线性表示.注意到 $\varepsilon _ i\in M\left(i=1,2,\dots,m\right),\, \overline{\varepsilon}=\overline{0}$ ，
\begin{align*}
\overline{\alpha} & =\overline{k _ 1\varepsilon _ 1+\dots+k _ m\varepsilon _ m+k _ {m+1}\varepsilon _ {m+1}+\dots+k _ n\varepsilon _ n} \\
& =k _ 1\overline{\varepsilon} _ 1+\dots+k _ m\overline{\varepsilon} _ m+k _ {m+1}\overline{\varepsilon} _ {m+1}+\dots+k _ n\overline{\varepsilon _ n}\\
& =k _ {m+1}\overline{\varepsilon} _ {m+1}+\dots+k _ n\overline{\varepsilon _ n}.
\end{align*}
5. 线性映射与线性变换 5.1. 线性映射

Theorem 19. 线性映射

f:U\rightarrow V

，且为单射.则

U

内向量组

\alpha_1,\dots,\alpha_l

线性无关的充分必要条
件是

f(\alpha_1),\dots,f(\alpha_l)

线性无关.

Theorem 20. 设

f

为

U,V

间同构映射，则对

U

的一组基

\varepsilon_1,\dots,\varepsilon_n,\, f(\varepsilon_1),\dots,f(\varepsilon_n)

是

V

的一组基，从而

\dim V=\dim U

对定理theorem431，若 $f(\alpha_1),\dots,f(\alpha_l)$ 线性无关，可
不依赖 $f$ 为单射推出 $\alpha_1,\dots,\alpha_l$ 线性无关.设
$k_1\alpha_1+\dots+k_l\alpha_l=0$ ，则
$k_1f(\alpha_1)+\dots+k_lf(\alpha_l)=0\Rightarrow k_1=\dots=k_l=0$ .

设 $\alpha_1,\dots,\alpha_l$ 线性无关， $k_1f(\alpha_1)+\dots+k_lf(\alpha_l)=f(k_1\alpha_1+\dots+k_l\alpha_l)=0$ .
由单射知 $k_1\alpha_1+\dots+k_l\alpha_l=0\Rightarrow k_1=\dots=k_l=0$ .

对定理theorem432，由上一个定理知 $f(\alpha_1),\dots,f(\alpha_l)$
线性无关. $\, \forall\, \beta\in V,\, \exists\, \alpha\in U,\, \mathrm{s.t.}\, f(\alpha)=\beta$ ，设 $\alpha=\sum k_i\alpha_i\Rightarrow\beta=\sum k_if(\alpha_i)$ ，由此知 $f(\varepsilon_1),\dots,f(\varepsilon_n)$ 是 $V$ 的一组基.
5.2. 线性空间的同构线性空间的同构关系是一种等价关系.如果 $U$ 是 $n$ 维线性空间，那么由定理theorem432，所有与 $U$ 同构的线性空间也都是 $n$ 维线性空间.反过来，如果 $U,V$ 都是 $n$ 维线性空间，那么由它们都与 $K^n$ 同构，知 $U$ 与 $V$ 同构.

Proposition 21.

f

是

U

到

V

的同构映射，则

f^{-1}

是

V

到

U

的同构映射.

5.3. 线性映射的核、像集、余核

Definition 22. 称

\ker f

为线性映射

f

的核，

\mathrm{im}f

为

f

的像集，

\mathrm{coker}f

为

f

的余核.

Theorem 23. 设

f\in\hom(U,V)

，

$\ker f$ 是 $U$ 的子空间，且 $f$ 为单射的充分必要条件是 $\ker f=\{0\}$ .
$\mathrm{im}f$ 是 $U$ 的子空间，且 $f$ 为满射的充分必要条件是 $\mathrm{coker}f=\{0\}.$

Theorem 24. 设

f\in\hom(U,V)

，则

U/\ker f

与

\mathrm{im}f

同构.

Corollary 25.

f\in\hom(U,V)

，则

\dim\ker f+\dim\mathrm{im}f=\dim U

设 $\varphi$ 为 $V$ 到 $V/M$ 的自然映射，不难看出，有 $\ker \varphi=M,\, \mathrm{im}\varphi=V/M$ .

对定理theorem433，不难得知 $\ker f,\mathrm{im}f$ 均是 $U$ 的子空间. $\, f$ 为单射时显然 $\ker f=\{0\}$ .反过来若 $\ker f=\{0\},\, f(\alpha)=f(\beta)\Rightarrow f(\alpha-\beta)=0\Rightarrow\alpha-\beta\in\ker f=\{0\}\Rightarrow\alpha=\beta$ ，于是 $f$ 为单射.而 $f$ 为满射等价于 $\mathrm{im}f=V$ ，等价于 $\mathrm{coker}f=V/\mathrm{im}f=\{0\}$ .

对定理theorem434，下面的逻辑推理似乎会有些抽象，但其直观意义其实很简单明白： $U$ 在￥ $f$ 下映为 $V$ 内同一个向量的全体向量是 $U$ 的一个子集，并且可以知道是 $\alpha+\ker f$ .如果把这些子集每一个当作一个单一元素，它们合并成为一个新集合，那么 $f$ 就成了这个新集合到 $V$ 的一一对应，变得较为单纯.而这个新集合就是商空间 $U/\ker f\, f$ 正好诱导出 $U/\ker f$ 到 $V$ 的线性空间同构.

取映射 $\tau(\alpha+\ker f)=f(\alpha)\in\mathrm{im}f$ ，可以证明 $\tau$ 为 $U/\ker f$ 到 $\mathrm{im}f$ 的同构映射.

用记号 $\overline{\alpha}=\alpha+\ker f$ .首先 $\tau$ 的定义在逻辑上无矛盾，即 $\alpha+\ker f=\beta+\ker f$ 时 $\tau(\overline{\alpha})=\tau(\overline{\beta})$ .此时 $\beta=\alpha+m,\, m\in\ker f$ .于是 $f(\beta)=f(\alpha)+f(m)=f(\alpha)\Rightarrow\tau(\overline{\alpha})=f(\alpha)=f(\beta)=\tau(\overline{\beta})$ .

$\tau$ 是线性映射.事实上， $\tau(k\overline{\alpha}+l\overline{\beta})=\tau(\overline{k\alpha+l\beta})=f(k\alpha+l\beta)=kf(\alpha)+lf(\beta) =k\tau(\overline{\alpha})+l\tau(\overline{\beta})$ .

$\tau$ 是单射.设 $\tau(\overline{\alpha})=\tau(\overline{\beta})\Rightarrow f(\alpha)=f(\beta)\Rightarrow f(\alpha-\beta)=0\Rightarrow \alpha-\beta\in\ker f\Rightarrow\alpha+\ker f=\beta+\ker f$ .

$\tau$ 显然是满射，故 $\tau$ 是 $U/\ker f$ 到 $\mathrm{im}f$ 的同构映射.

$f$ 给出了 $U$ 到 $\mathrm{im}f$ 的映射， $\varphi$ 给出了 $U$ 到 $U/\ker f$ 的映射，而 $\tau$ 则是 $\ker f$ 到 $\mathrm{im}f$ 的映射，事实上，
\[\tau\varphi(\alpha)=\tau(\overline{\alpha})=f(\alpha)\Longleftrightarrow f=\tau\circ\varphi.\]

上述满足条件的同构映射 $\tau$ 也是唯一的.若 $\tau^\prime$ 也使 $f=\tau^\prime \circ\varphi$ ，则 $\tau^\prime (\overline{\alpha})=f(\alpha)=\varphi(\overline{\alpha})\Rightarrow\tau^\prime =\tau$ .

给定 $m\times n$ 矩阵 $A,\, A$ 给出了 $K^n$ 到 $K^m$ 的一个保持加法、数乘运算的映射，亦即线性映射： $f_A(X)=AX$ .现在， $\ker A$ 是齐次线性方程组 $AX=0$ 的解空间.设 $A$ 的列向量组为 $\alpha_1,\dots,\alpha_n$ ，对 $K^n$ 的坐标向量 $X_j$ 有 $f_A(X_j)=\alpha_j$ ，而 $K^n=L(X_1,\dots,X_n)$ ，故 $\mathrm{im}f_A=L(\alpha_1,\dots,\alpha_n)$ ，也就是说 $\mathrm{im}f_A$ 是 $A$ 的列向量组生成的线性空间.

线性方程组 $AX=B$ 有解的充分必要条件是 $B\in L(\alpha_1,\dots,\alpha_n)\Leftrightarrow B\in\mathrm{im}f_A$ .而 $\mathrm{coker}f_A=K^m/L(\alpha_1,\dots,\alpha_n)$ 成了 $AX=B$ 有解的一个量度.

利用推论tuilun431， $\dim\mathrm{im}f_A=r(A)=r,\, \dim \ker f_A=\dim K^n-\dim\mathrm{im}f_A=n-r$ .这是第二章已经得到的定理.
5.4. 线性映射的矩阵把矩阵提升为一般的线性映射是理论上的一大进步，对许多问题的认识也大大深入.另一方面，当面临需要对某些问题作具体技术时，又要把抽象的线性映射具体化为矩阵.

Theorem 26. 设

U

的一组基为

\varepsilon_1,\dots,\varepsilon_n

，

V

的一组基为

\eta_1,\dots,\eta_m

$f\in\hom(U,V)$ 由 $f(\varepsilon_1),\dots,f(\varepsilon_n)$ 唯一决定，
任给 $V$ 内 $n$ 个向量 $\alpha_1,\dots,\alpha_n$ ，确定了唯一的 $f\in\hom(U,V)$ ，使 $f(\varepsilon_i)=\alpha_i$ .

Definition 27. \[(f(\varepsilon_1),\dots,f(\varepsilon_n))=(\eta_1,\dots,\eta_m)A,\]
称

A

为线性映射

f

在给定基下的矩阵.

Proposition 28. 定义映射

\sigma:\hom(U,V)\rightarrow M_{m,n}(K)

.不同的

f

，由定理theorem435的（i），有某个不同的

f(\varepsilon_i)

，从而

A=\sigma(f)

不同，这说明

\sigma

为单射；任一矩阵

A

，由定理theorem435的（ii），可以找到一个

f

，使其在所给定的基下的矩阵为

A

.因此

\sigma

是双射.

对定理theorem435，如果 $f(\varepsilon_i)\equiv g(\varepsilon_i)$ ，设 $\alpha=\sum x_i\varepsilon_i\Rightarrow f(\alpha)=\sum x_if(\varepsilon_i)=\sum x_ig(\varepsilon_i)=g(\alpha)$ .对 $U$ 内一向量 $\alpha=(\varepsilon_1,\dots,\varepsilon_n)X$ ，令 $f(\alpha)=f((\varepsilon_1,\dots,\varepsilon_n)X)=(\alpha_1,\dots,\alpha_n)X$ （这里的构造其实是利用形式结合律给出），可以看出 $f\in\hom(U,V)$ .又设 $\beta=(\varepsilon_1,\dots,\varepsilon_n)Y$ ，
\begin{align*}
f(k\alpha+l\beta){} & =f((\varepsilon_1,\dots,\varepsilon_n)(kX+lY))=(\alpha_1,\dots,\alpha_n)(kX+lY)\\
& =k(\alpha_1,\dots,\alpha_n)X+l(\alpha_1,\dots,\alpha_n)Y=kf(\alpha)+f(\beta).
\end{align*}
这个 $f$ 已满足 $f(\varepsilon_i)=\alpha_i$ ，而 $f$ 的唯一性由（i）推出.

对命题prop432，给定 $m\times n$ 矩阵 $A$ ，令 $(\alpha_1,\dots,\alpha_n)=(\eta_1,\dots,\eta_n)A$ ，则存在唯一的 $f\in\hom(U,V)$ 使 $f(\varepsilon_i)\equiv\alpha_i$ ，即 $(f(\varepsilon_1),\dots,f(\varepsilon_n))=(\eta_1,\dots,\eta_m)A$ ，于是 $\sigma(f)=A$ .

Proposition 29. 约定

f(\alpha_1,\alpha_2,\dots,\alpha_n)=(f(\alpha_1),f(\alpha_2),\dots,f(\alpha_n))

.有
\[f[(\varepsilon_1,\dots,\varepsilon_n)X]=[f(\varepsilon_1),f(\varepsilon_2),\dots,f(\varepsilon_n)]X=[f(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)]X.\]
其中

X\in K^n

一般地，设 $\alpha_1=(\varepsilon_1,\dots,\varepsilon_n)X_1,\dots,\alpha_s=(\varepsilon_1,\dots,\varepsilon_n)X_s$ ，则有 $f(\alpha_i)=[f(\varepsilon_1,\dots,\varepsilon_n)]X_i$ .\以 $X_1,\dots,X_s$ 为列向量排成 $n\times s$ 矩阵 $X$ ，则有
\begin{align*}
f[(\varepsilon_1,\dots,\varepsilon_n)X]{} & =f(\alpha_1,\alpha_2,\dots,\alpha_n)=(f(\alpha_1),f(\alpha_2),\dots,f(\alpha_n))=[f(\varepsilon_1),\dots,f(\varepsilon_n)]X \\
& =[f(\varepsilon_1,\dots,\varepsilon_n)]X.
\end{align*}

Theorem 30. 双射

\sigma

保持

\hom(U,V)

的运算和

M_{m,n}K

内运算的对应关系.
\[\sigma(kf+lg)=k\sigma(f)+l\sigma(g).\]
因此

\sigma

是

\hom(U,V)

到

M_{m,n}K

的同构映射.于是
\[\dim\hom(U,V)=\dim M_{m,n}(K)=mn.\]

Theorem 31. \[\sigma(g\circ f)=\sigma(g)\sigma(f).\]

设 $\sigma(f)=A,\sigma(g)=B$ ，可证 $kf+lg$ 在所取基下矩阵为 $kA+lB=k\sigma(f)+l\sigma(g)$ ，定理theorem436即证.
\begin{align*}
& ((kf+lg)\varepsilon_1,\dots,(kf+lg)\varepsilon_n) \\
={} & (kf(\varepsilon_1)+lg(\varepsilon_1),\dots,kf(\varepsilon_1)+lg(\varepsilon_1))\\
={} & k(f(\varepsilon_1),\dots,f(\varepsilon_n))+l(g(\varepsilon_1),\dots,g(\varepsilon_n))\\
={} & k(\eta_1,\dots,\eta_n)A+l(\eta_1,\dots,\eta_n)B\\
={} & (\eta_1,\dots,\eta_n)(kA+lB).
\end{align*}

在 $U,V,W$ 内分别取一组基 $\varepsilon_,\dots,\varepsilon_n;\, \eta_1,\dots,\eta_m;\, \delta_1,\dots,\delta_s$ .又设 $\sigma(f)=A,\sigma(g)=B$ .
\begin{align*}
& (g\circ f(\varepsilon_1),\dots,g\circ f(\varepsilon_n))=g(f(\varepsilon_1),\dots,f(\varepsilon_n)) \\
={} & g[(\eta_1,\dots,\eta_m)A]=[g(\eta_1,\dots,\eta_m)]A=[g(\eta_1),\dots,g(\eta_m)]A\\
={} & [(\delta_1,\dots,\delta_s)B]A=(\delta_1,\dots,\delta_s)(BA).
\end{align*}

最后给出如下定理，将从更高的观点看到：相抵实际上就是同一个线性映射在不同基下的矩阵之间的关系，这就把相抵概念的实质完全弄清楚：

Theorem 32.

\dim U=n,\dim V=m

.设

A

是

f

在取定基

\varepsilon_1,\dots,\varepsilon_n;\eta_1,\dots,\eta_m

下的矩阵.则

$B\in M_{m,n}(K)$ 是另外取定基下的矩阵的充分必要条件是 $B$ 与 $A$ 相抵，即 $r(B)=r(A)$ .

证：先证必要性.设 $f(\varepsilon^\prime _1,\dots,\varepsilon^\prime _n)=(\eta^\prime _1,\dots,\eta^\prime _m)B$ .并令 $(\varepsilon^\prime _1,\dots,\varepsilon^\prime _n)=(\varepsilon_1,\dots,\varepsilon_n)Q,\, (\eta^\prime _1,\dots,\eta^\prime _m)=(\eta_1,\dots,\eta_m)P$ ，其中 $Q,P$ 分别为 $n,m$ 阶可逆方阵.代入得
\begin{gather*}
\begin{split}
f(\varepsilon^\prime _1,\dots,\varepsilon^\prime _n) & =f[(\varepsilon_1,\dots,\varepsilon_n)Q] =[f(\varepsilon_1,\dots,\varepsilon_n)]Q =(\eta_1,\dots,\eta_n)(AQ).\
(\eta^\prime _1,\dots,\eta^\prime _m)B & =[(\eta_1,\dots,\eta_m)P]B =(\eta_1,\dots,\eta_m)(PB).
\end{split} \
AQ=PB\Longleftrightarrow B=P^{-1}AQ\Longleftrightarrow B,A\, \text{相抵}.
\end{gather*}

下证充分性.若 $B$ 与 $A$ 相抵，存在 $m,n$ 阶可逆方阵 $R,Q$ 使 $B=RAQ$ ，令 $P=R^{-1}$ ，在 $U,V$ 内各作基变换 $(\varepsilon^\prime _ 1,\dots,\varepsilon^\prime _ n)=(\varepsilon _ 1,\dots,\varepsilon _ n)Q,\, (\eta^\prime _ 1,\dots,\eta^\prime _ m)=(\eta _ 1,\dots,\eta _ m)P$ .不难看出 $f$ 在新取定的基下矩阵为 $P^{-1}AQ=RAQ=B$ .

5.5. 线性变换的基本概念这段开始把对线性映射的讨论限制到一种最重要的情况，即 $U=V$ 的情况.

Proposition 33. 单位变换在

\varepsilon _ 1,\dots,\varepsilon _ n

下的矩阵为

E

，有
\[\textbf{E}=\textbf{A}\circ\textbf{B}=\textbf{B}\circ\textbf{A}\Longleftrightarrow E=\sigma(\textbf{A})\sigma(\textbf{B})=\sigma(\textbf{B})\sigma(\textbf{A}).\]
即

\textbf{A}

为可逆线性变换的充分必要条件是

\sigma(\textbf{A})

为可逆方阵，而且

\sigma(\textbf{A}^{-1})=\sigma(\textbf{A})^{-1}

，其中用到了

\sigma

为双射这一结论.

Theorem 34. 设向量

\alpha

在一组基下的坐标为

X

，则

\textbf{A}\alpha

在这组基下的坐标为

AX

.
\begin{align*}
\textbf{A}\alpha{} & =\textbf{A}[(\varepsilon _ 1,\dots,\varepsilon _ n)X]=[\textbf{A}(\varepsilon _ 1,\dots,\varepsilon _ n)]X \\
& =[(\varepsilon _ 1,\dots,\varepsilon _ n)A]X\\
& =(\varepsilon _ 1,\dots,\varepsilon _ n)(AX).
\end{align*}

5.6. 线性变换在不同基下的矩阵

Theorem 35. 设

(\eta _ 1,\eta _ 2,\dots,\eta _ n)=(\varepsilon _ 1,\varepsilon _ 2,\dots,\varepsilon _ n)T

，线性变换

\textbf{A}

在两组基

\varepsilon _ ,\dots,\varepsilon _ n;\eta _ 1,\dots,\eta _ n

下的矩阵分别为

A

和

B

，则
\[B=T^{-1}AT.\]

Theorem 36.

A,B

相似的充分必要条件是它们是

V

内某一线性变换在两组基下的矩阵.

\begin{align*}
\boldsymbol{A}(\eta _ 1,\dots,\eta _ n) & =(\eta _ 1,\dots,\eta _ n)B \\
\boldsymbol{A}[(\varepsilon _ 1,\varepsilon _ 2,\dots,\varepsilon _ n)T] & =[(\varepsilon _ 1,\varepsilon _ 2,\dots,\varepsilon _ n)T]B\\
[\boldsymbol{A}(\varepsilon _ 1,\varepsilon _ 2,\dots,\varepsilon _ n)]T & =(\varepsilon _ 1,\varepsilon _ 2,\dots,\varepsilon _ n)(TB)\\
(\varepsilon _ 1,\varepsilon _ 2,\dots,\varepsilon _ n)(AT) & =(\varepsilon _ 1,\varepsilon _ 2,\dots,\varepsilon _ n)(TB).
\end{align*}

由 $\varepsilon _ 1,\dots,\varepsilon _ n$ 线性无关即 $T$ 可逆，

\[AT=TB\Longleftrightarrow B=T^{-1}AT.\]

若 $B\sim A$ ，则存在可逆矩阵 $T$ 使 $B=T^{-1}AT$ ，现在可以找到一个线性变换，它在一组基 $\varepsilon _ 1,\dots,\varepsilon _ n$ 下的矩阵为 $A$ .令 $(\eta _ 1,\dots,\eta _ n)=(\varepsilon _ 1,\dots,\varepsilon _ n)T$ ，则由theorem413， $(\eta _ 1,\dots,\eta _ n)$ 是一组基，原线性变换在此新基下的矩阵为 $T^{-1}AT=B$ .
6. 线性变换的特征值与特征向量对数域 $K$ 上 $n$ 维线性空间 $V$ 内的一个线性变换 $\boldsymbol{A}$ ，希望找到一组基 $\eta _ 1,\dots,\eta _ n$ 使 $\boldsymbol{A}$ 在这组基下的矩阵具有最简单的形式.对于矩阵运算来说，对角形最为简单.自然要问能不能找到一组基使 $\boldsymbol{A}$ 在这组基下的矩阵具有对角形？
\[(\boldsymbol{A}\eta _ 1,\dots,\boldsymbol{A}\eta _ n)=(\eta _ 1,\dots,\eta _ n)
\begin{bmatrix}
\lambda _ 1 & & & \\
& \lambda _ 2 & & \\
& & \ddots & \\
& & & \lambda _ n
\end{bmatrix}.
\]
具体写出来就是 $\boldsymbol{A}\eta _ 1=\lambda _ 1\eta _ 1,\boldsymbol{A}\eta _ 2=\lambda _ 2\eta _ 2,\dots,\boldsymbol{A}\eta _ n=\lambda _ n\eta _ n$ .这并不总能办到，但有一个重要启示：研究满足条件 $\boldsymbol{A}\xi=\lambda\xi$ 的属于数域 $K$ 的数 $\lambda$ 和非零的向量 $\xi$ .
6.1. 特征值与特征向量的定义 $V _ {\lambda}=\left\{\alpha\in V\mid\boldsymbol{A}\alpha=\lambda\alpha\right\}$ 是 $V$ 的子空间.

$\lambda\in K$ 是特征值的充分必要条件是 $V _ {\lambda}\neq\{0\}$ ；
要找出属于特征值 $\lambda$ 的全部特征向量，只要决定出特征子空间 $V$ ，特别地，当 $V _ {\lambda}$ 是有限维子空间时，只要找出它的一组基，就等于找出 $V _ {\lambda}$ 的所有向量.

需要解决两个问题： $1.$ 决定 $K$ 内所有使 $V _ {\lambda}\neq\{0\}$ 的数 $\lambda$ ； $2.$ 当 $V _ {\lambda}\neq\{0\}$ 时找出它的一组基.

$\boldsymbol{A}\alpha=(\varepsilon _ 1,\dots,\varepsilon _ n)(AX),\, \lambda\alpha=(\varepsilon _ 1,\dots,\varepsilon _ n)(\lambda X)$ .于是 $V$ 内的定义式等价于 $K^n$ 的关系式 $AX=\lambda X$ ，而 $\alpha\neq0\Leftrightarrow X\neq0$ .于是 $V _ {\lambda}\neq\{0\}$ 等价于有非零 $\alpha\in V$ 使 $\boldsymbol{A}\alpha=\lambda\alpha$ ，等价于有非零 $X\in K^n$ 使 $AX=\lambda X$ ，即 $(\lambda E-A)X=0$ 有非零解，其充分必要条件是 $|\lambda E-A|=0$ .第一个问题解决.

要找出 $V _ {\lambda}\neq\{0\}$ 的一组基.已知 $\alpha\in V _ {\lambda}$ 等价于其坐标 $X$ 满足 $(\lambda E-A)X=0$ .在 $V$ 内取定一组基后， $V$ 中向量对应于其坐标 $X$ ，这是 $V$ 到 $K^n$ 的一个同构映射 $f.\; f(V _ {\lambda})$ 正好是 $(\lambda E-A)X=0$ 的解空间.只要找出一个基础解系，也就是找出解空间的一组基，这组基在 $f^{-1}$ 的作用下得到的就是 $V _ {\lambda}\neq\{0\}$ 的一组基.至此，两个问题都得到完满解答.
6.2. 特征多项式的基本性质

Theorem 37. 相似的矩阵有相同的特征多项式.

\, |\lambda E-B|=|\lambda E-T^{-1}AT|=|T^{-1}(\lambda E-A)T|=|\lambda E-A|

.而反过来不成立，即两个同阶方阵特征多项式相同，它们未必相似.

Theorem 38. 设

\lambda _ 1,\dots,\lambda _ n

是

f(\lambda)

在复数域内的

n

个根，
\begin{gather*}
\lambda+\lambda _ 2+\dots+\lambda _ n=\mathrm{tr}(A), \
\lambda _ 1\lambda _ 2\cdots\lambda _ n=|A|.
\end{gather*}

Theorem 39. 设

A,B

分别为

n\times m,\, m\times n

矩阵，
\[\lambda^m|\lambda E _ n-AB|=\lambda^n|\lambda E _ m-AB|.\]
从而得出

m=n

时，

AB

与

BA

的特征多项式相同.

设 $f(\lambda)=a _ 0\lambda^m+a _ 1\lambda^{m-1}+\dots+a _ m$ ，显然 $a _ m=f(0)=\left|-A\right|=(-1)^n|A|$ ，故只需证 $m=n,\, a _ 0=1,\, a _ 1=-\mathrm{tr}(A)$ .

归纳证之.当 $n=1$ 时， $f(\lambda)=\lambda-a _ {11}$ ，显然成立.下面设 $n-1$ 阶方阵成立，一方面，
\[f^\prime (\lambda)=a _ 0m\lambda^{m-1}+a _ 1(m-1)\lambda^{m-2}+\dots+a _ {m-1},\]
另一方面由定理theorem324，
\[f^\prime (\lambda)=\frac{\mathrm{d}}{\mathrm{d}\lambda}\left|\lambda E-A\right|=\sum _ {i=1}^{n}\left|(\lambda E-A) _ i\right|,\]
其中 $(\lambda E-A) _ i$ 表示对第 $i$ 行求导，把 $(\lambda E-A) _ i$ 对第 $i$ 行（该行除了第 $i$ 列为 $1$ 其余为 $0$ ）展开，利用归纳假设，有
\begin{align*}
\left|(\lambda E-A) _ i\right| & =\begin{vmatrix}
\lambda-a _ {11} & \cdots & -a _ {1i} & \cdots & -a _ {1n} \\
\vdots & & & & \vdots \\
0 & \cdots & 1 & \cdots & 0 \\
\vdots & & & & \vdots \\
-a _ {n1} & \cdots & -a _ {ni} & \cdots & \lambda-a _ {nn}
\end{vmatrix} \\
& =\left|\lambda E _ {n-1}-A( _ i^i)\right|=\lambda^{n-1}-\mathrm{tr}(A( _ i^i))\lambda^{n-2}+\cdots\\
& =\lambda^{n-1}-(\mathrm{tr}(A)-a _ {ii})\lambda^{n-2}+\cdots
\end{align*}
代回原式，
\begin{align*}
f^\prime (\lambda) & =\sum _ {i=1}^{n}(\lambda^{n-1}-(\mathrm{tr}(A)-a _ {ii})\lambda^{n-2}+\cdots) \\
& =n\lambda^{n-1}-(n-1)\mathrm{tr}(A)\lambda^{n-2}+\cdots\\
& =a _ 0m\lambda^{m-1}+a _ 1(m-1)\lambda^{m-2}+\dots+\cdots.
\end{align*}

借助分块矩阵的技巧，可以得到定理theorem443的证明.
\begin{align*}
\begin{vmatrix}
E _ m & 0 \\
-A & E _ n
\end{vmatrix}\begin{vmatrix}
\lambda E _ m & B \\
\lambda A & \lambda E _ n
\end{vmatrix} & =\begin{vmatrix}
\lambda E _ m & B \\
0 & \lambda E _ n-AB
\end{vmatrix}=\lambda^m\left|\lambda E _ n-AB\right| \\
\begin{vmatrix}
\lambda E _ m & B \\
\lambda A & \lambda E _ n
\end{vmatrix}\begin{vmatrix}
E _ m & 0 \\
-A & E _ n
\end{vmatrix} & =\begin{vmatrix}
\lambda E _ m-BA & B \\
0 & \lambda E _ n
\end{vmatrix}=\lambda^n\left|\lambda E _ m-BA\right|.
\end{align*}
6.3. 具有对角形矩阵的线性变换

Theorem 40. 线性变换

\boldsymbol{A}

的矩阵可对角化的充分必要条件是

\boldsymbol{A}

有

n

个线性无关的特征向量.

Proposition 41. 线性变换

\boldsymbol{A}

的属于不同特征值的特征向量线性无关.

Corollary 42. 如果

\boldsymbol{A}

有

n

个不同的特征值，那么它的矩阵可对角化.

Proposition 43. 设数

\lambda _ i

互不相等，则子空间

V _ {\lambda _ i}

的和

\sum V _ {\lambda _ i}

是直和.

Theorem 44. 设

\lambda _ 1,\dots,\lambda _ k

是

\boldsymbol{A}

的全部互不相同的特征值，则

A

可对角化的充分必要条件是
\[V=V _ {\lambda _ 1}\oplus V _ {\lambda _ 2}\oplus\dots\oplus V _ {\lambda _ k}=\bigoplus _ {i=1}^k V _ {\lambda _ i}.\]

在 $\boldsymbol{A}$ 可对角化的情况下，每个 $V _ {\lambda _ i}$ 中任取一组基，合并后得到 $V$ 的一组基，在这组基下 $\boldsymbol{A}$ 的矩阵为对角矩阵.

如果 $\boldsymbol{A}$ 的矩阵可对角化，在某组基下的矩阵成对角形，这组基即是 $\boldsymbol{A}$ 的 $n$ 个线性无关的特征向量.而若 $\boldsymbol{A}$ 有 $n$ 个线性无关的特征向量，它们组成 $V$ 的一组基，显然 $\boldsymbol{A}$ 在这组基下的矩阵成对角形.

设特征向量 $\xi _ 1,\dots,\xi _ k$ 分别属于不同的特征值 $\lambda _ 1,\dots,\lambda _ k$ ，对 $k$ 作归纳.当 $k=1$ 时，由 $\xi _ 1\neq0$ ，当然线性无关，可知成立.设在 $k-1$ 个不同的特征值时已经成立，可证 $k$ 个不同特征值的情况也成立.考察 $l _ 1\lambda _ 1+\dots+l _ k\lambda _ k=0$ ，两边作线性变换得 $l _ 1\boldsymbol{A}\lambda _ 1+\dots+l _ k\boldsymbol{A}\lambda _ k=0$ ，即 $l _ 1\lambda _ 1\xi _ 1+\dots+l _ k\lambda _ k\xi _ k=0$ .而
$\lambda _ 1(l _ 1\lambda _ 1+\dots+l _ k\lambda _ k)=0\Rightarrow l _ 2(\lambda _ 1-\lambda _ 2)\xi _ 2+\dots+l _ k(\lambda _ 1-\lambda _ k)\xi _ k=0\Rightarrow l _ 2(\lambda _ 1-\lambda _ 2)=\dots=l _ k(\lambda _ 1-\lambda _ k)=0\Rightarrow l _ 2=\dots=l _ k=0\Rightarrow l _ 1=0$ .从而 $\xi _ 1,\dots,\xi _ k$ 线性无关.

设 $0=\sum\alpha _ i\, (\alpha _ i\in V _ {\lambda _ i})$ ，可证其表法为一.若某个 $\alpha _ i$ 不为 $0$ ，则它是属于特征值 $\lambda _ i$ 的特征向量，上式表明一些属于不同特征值的特征向量线性相关，与上面的命题矛盾，从而 $\sum V _ {\lambda _ i}$ 是直和.

对于定理theorem445，设 $M=\bigoplus V _ {\lambda _ i}\subseteq V$ .如果 $M=V$ ，在每个 $V _ {\lambda _ i}$ 中任取一组基，合并后得到 $V$ 的一组基，这组基里的向量是 $\boldsymbol{A}$ 的 $n$ 个线性无关的特征向量，故 $\boldsymbol{A}$ 在这组基下的矩阵成对角矩阵；如果 $\boldsymbol{A}$ 的在某组基下的矩阵可对角化，那么这组基的每个向量都是特征向量，必属于某特征子空间 $V _ {\lambda _ i}\subseteq M$ ，那么任一 $\alpha\in V$ 都属于 $M$ ，于是 $V=M$ .

$M=V$ 的充分必要条件是 $\dim V _ {\lambda _ 1}+\dots+\dim V _ {\lambda _ k}=\dim V$ ，所以定理条件是否满足可通过计算特征值和特征子空间的一组基立刻得到解决.

Theorem 45.

\boldsymbol{A}

的矩阵可对角化的充分必要条件是存在

K

内互不相同的数

\lambda _ ,\dots,\lambda _ k

使
\[(\lambda _ 1\boldsymbol{E}-\boldsymbol{A})\circ(\lambda _ 2\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ k\boldsymbol{E}-\boldsymbol{A})=\boldsymbol{0}.\]

Definition 46. 称

\boldsymbol{A}

为完全可约线性变换，如果任给不变子空间

M

，都存在不变子空间

N

，使

V=M\oplus N

Theorem 47. 对复数域上的

n

维线性空间内一线性变换，矩阵可对角化的充分必要条件是它是完全可约的.

定理theorem446证明：必要性：若 $\boldsymbol{A}$ 的矩阵可对角化，由定理theorem445， $V=V _ {\lambda _ 1}\oplus V _ {\lambda _ 2}\oplus\dots\oplus V _ {\lambda _ k}$ .此时，对任意 $\alpha\in V _ {\lambda _ i}$ ,有 $(\lambda _ i\boldsymbol{E}-\boldsymbol{A})\alpha=\boldsymbol{0}$ .注意到
\[(\lambda _ s\boldsymbol{E}-\boldsymbol{A})\circ(\lambda _ t\boldsymbol{E}-\boldsymbol{A})\alpha=(\lambda _ t\boldsymbol{E}-\boldsymbol{A})\circ(\lambda _ s\boldsymbol{E}-\boldsymbol{A})\alpha \]
有
\begin{align*}
&(\lambda _ 1\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ i\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ k\boldsymbol{E}-\boldsymbol{A})\alpha \\ ={}&(\lambda _ 1\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ {i-1}\boldsymbol{E}-\boldsymbol{A})\circ(\lambda _ {i+1}\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ k\boldsymbol{E}-\boldsymbol{A})\circ(\lambda _ {i}\boldsymbol{E}-\boldsymbol{A})\alpha \\
={}&0.
\end{align*}

现在对任意 $\alpha\in V,\, \alpha=\sum \alpha _ i$ ，于是
\begin{align*}
& (\lambda _ 1\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ i\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ k\boldsymbol{E}-\boldsymbol{A})\sum\alpha _ i \\
={} & \sum(\lambda _ 1\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ i\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ k\boldsymbol{E}-\boldsymbol{A})\alpha _ i\\
={} & 0.
\end{align*}

充分性：设 $\boldsymbol{A}$ 在某组基下的矩阵为 $A$ ，那么 $(\lambda _ 1E-A)(\lambda _ 2E-A)\cdots(\lambda _ kE-A)=0$ .不难看出有
\[r(\lambda _ 1E-A)+r(\lambda _ 2E-A)+\dots+r(\lambda _ kE-A)\leqslant(k-1)n.\]
注意到 $\dim V _ {\lambda _ i}$ 为 $(\lambda _ iE-A)X=0$ 的解空间的维数，于是
\[n\leqslant \sum (n-r(\lambda _ iE-A))\Longleftrightarrow\dim V\leqslant\sum\dim V _ {\lambda _ i}\Longleftrightarrow \dim V=\dim \sum V _ {\lambda _ i}.\]
由前面的推理知 $\sum V _ {\lambda _ i}$ 是直和，故 $V=V _ {\lambda _ 1}\oplus V _ {\lambda _ 2}\oplus\dots\oplus V _ {\lambda _ k}$ .

定理theorem447证明：必要性：矩阵可对角化，则有 $V=\bigoplus V _ {\lambda _ i}$ .现令 $M _ i=M\cap V _ {\lambda _ i}$ ，由定理theorem449， $M=\bigoplus M _ i$ .设 $M _ i$ 对 $V _ {\lambda _ i}$ 的补空间为 $N _ i$ .由 $N _ i\subseteq V _ {\lambda _ i}$ 知 $\sum N _ i$ 为直和，令 $N=\bigoplus N _ i$ ，下证它是 $\boldsymbol{A}$ 的不变子空间且是 $M$ 对 $V$ 的补空间.对任意子空间 $N _ i$ 中向量 $\alpha$ ，有 $\boldsymbol{A}\alpha=\lambda _ i\alpha\in N _ i$ ，故 $N _ i$ 是不变子空间，从而 $N$ 是不变子空间.现又有 $M+N=\sum M _ i+\sum N _ i=\sum(M _ i+N _ i)=\sum V _ {\lambda _ i}=V$ ，来证 $M+N$ 是直和.设 $0=\alpha+\beta\; (\alpha\in M,\beta\in N)$ ，有 $0=\sum \alpha _ i+\sum \beta _ i=\sum(\alpha _ i+\beta _ i)$ ，而 $\alpha _ i+\beta _ i\in V _ {\lambda _ i}\Rightarrow \alpha _ i+\beta _ i=0$ ，又 $M _ i\oplus N _ i=V _ {\lambda _ i}$ ，故 $\alpha _ i=\beta _ i=0\Rightarrow\alpha=\beta=0\Rightarrow V=M\oplus N$ .

充分性：先给出如下引理：

Lemma 48.

M,N

是

V

的子空间且

M\subseteq N,\, V=M\oplus L

，则

N=M\oplus(N\cap L)

$V$ 是复数域上的，故必有一特征根 $\lambda _ 1$ ，设 $\alpha _ 1$ 是其特征向量，则： $M=L(\alpha _ 1)$ 为 $\boldsymbol{A}$ 的一维不变子空间，由 $\boldsymbol{A}$ 是完全可约的，存在 $n-1$ 维的不变子空间 $N$ 使 $V=M\oplus N$ ，可以证明 $\boldsymbol{A}| _ N$ 也是完全可约的.再对 $V$ 的维数 $n$ 归纳： $n=1$ 时矩阵当然是对角矩阵，假定结论对 $n-1$ 成立，则对 $\dim V=n$ ，上面已有 $V=L(\alpha _ 1)\oplus N,\; \boldsymbol{A}| _ N$ 完全可约，由归纳假设 $N$ 中存在一组基使 $\boldsymbol{A}| _ N$ 的矩阵成对角形，就有 $\boldsymbol{A}\alpha _ i=\lambda _ i\alpha _ i\; (i\geqslant 2)$ ，这样在 $V$ 的基 $\alpha _ 1,\alpha _ 2,\dots,\alpha _ n$ 下 $\boldsymbol{A}$ 的矩阵成对角形.

下面证 $\boldsymbol{A}| _ N$ 完全可约，即对任一 $\boldsymbol{A}| _ N$ 的不变子空间 $S$ ，存在 $\boldsymbol{A}| _ N$ 的不变子空间 $T$ 使 $N=S\oplus T$ .由 $\boldsymbol{A}$ 完全可约， $S\subseteq N\subseteq A$ ，存在 $\boldsymbol{A}$ 的不变子空间 $R$ 使 $V=S\oplus R$ .由引理， $N=S\oplus(N\cap R)$ ，而 $T=(N\cap R)$ 是 $\boldsymbol{A}| _ N$ 的不变子空间，故欲证成立.
6.4. 不变子空间

Theorem 49. 存在一组基使在这组基下的矩阵成准对角形的充分必要条件是，

V

可分解为

\boldsymbol{A}

的不变子空间

M _ 1,\dots,M _ s

的直和：

V=M _ 1\oplus M _ 2\oplus\dots\oplus M _ s=\bigoplus M _ i

Theorem 50. 如果

\boldsymbol{A}

的矩阵可对角化，则对

\boldsymbol{A}

的任意不变子空间

M,\, \boldsymbol{A}| _ M

的矩阵也可对角化.

若 $\boldsymbol{A}$ 在基 $\varepsilon _ 1,\dots,\varepsilon _ n$ 下的矩阵成准对角形
\[A=\begin{bmatrix}
\begin{matrix}
A _ 1 & \\
& A _ 2
\end{matrix} & 0 \\
0 & \begin{matrix}
\ddots & \\
& A _ s
\end{matrix}
\end{bmatrix},\]
把这组基按 $A _ i$ 的阶 $n _ i$ 分为 $s$ 段： $\varepsilon _ {11},\varepsilon _ {12}，\dots,\varepsilon _ {1n _ 1},\dots,\varepsilon _ {s1},\varepsilon _ {s2},\dots,\varepsilon _ {sn _ s}$ .这时有 $(\boldsymbol{A}\varepsilon _ {i1},\dots,\boldsymbol{A}\varepsilon _ {in _ i})=(\varepsilon _ {i1},\dots,\varepsilon _ {in _ i})A _ i$ .则 $M _ i=L(\varepsilon _ {i1},\dots,\varepsilon _ {in _ i})$ 是 $\boldsymbol{A}$ 的不变子空间，且 $\sum M _ i=V$ .而 $\dim\sum M _ i=n=\sum n _ i=\sum\dim M _ i$ ，故 $V=M _ 1\oplus M _ 2\oplus\dots\oplus M _ s$ .

设 $V=M _ 1\oplus M _ 2\oplus\dots\oplus M _ s$ ，在每个不变子空间 $M _ i$ 内取一组基，合并成 $V$ 的一组基，则 $\boldsymbol{A}$ 在这组基下的矩阵成准对角形.

定理theorem449看似显然，实则不是很简单.范德蒙德行列式在这其中又发挥了其神奇作用.设 $V=V _ {\lambda _ 1}\oplus V _ {\lambda _ 2}\oplus\dots\oplus V _ {\lambda _ k}$ ，对一不变子空间 $M$ ，令 $N _ i=M\cap V _ {\lambda _ i}$ ，可以证明 $M=N _ {\lambda _ 1}\oplus N _ {\lambda _ 2}\oplus\dots\oplus N _ {\lambda _ k}$ .

设 $0=\sum\alpha _ i,\, \alpha _ i\in N _ i\subseteq V _ {\lambda _ i}$ ，而 $\sum V _ {\lambda _ i}$ 为直和，故 $\alpha _ i\equiv0$ ，所以 $\sum N _ i$ 为直和.

显然 $\sum N _ i\subseteq M$ ，只要证任意 $\alpha\in M,\, \alpha$ 可表为 $\sum\alpha _ i\, (\alpha _ i\in N _ i)$ 即可.
\begin{align*}
\alpha & =\alpha _ 1+\alpha _ 2+\dots+\alpha _ k\; (\alpha _ i\in V _ {\lambda _ i}) \\
\boldsymbol{A}\alpha & =\lambda _ 1\alpha _ 1+\lambda _ 2\alpha _ 2+\dots+\lambda _ k\alpha _ k\\
& \cdots\\
\boldsymbol{A}^{k-1}\alpha & =\lambda^{k-1} _ 1\alpha _ 1+\lambda^{k-1} _ 2\alpha _ 2+\dots+\lambda^{k-1} _ k\alpha _ k,
\end{align*}
即
\[\begin{bmatrix}
\alpha \\
\boldsymbol{A}\alpha \\
\vdots \\
\boldsymbol{A}^{n-1}\alpha
\end{bmatrix}=
\begin{bmatrix}
1 & 1 & \cdots & 1 \\
\lambda _ 1 & \lambda _ 2 & \cdots & \lambda _ k \\
\vdots & \vdots & & \vdots \\
\lambda^{k-1} _ 1 & \lambda^{k-1} _ 2 & \cdots & \lambda^{k-1} _ k
\end{bmatrix}
\begin{bmatrix}
\alpha _ 1 \\
\alpha _ 2 \\
\vdots \\
\alpha _ k
\end{bmatrix}.\]
上式中的方阵可逆，是逆矩阵为 $T$ ，则
\[\begin{bmatrix}
\alpha _ 1 \\
\alpha _ 2 \\
\vdots \\
\alpha _ k
\end{bmatrix}=T\begin{bmatrix}
\alpha \\
\boldsymbol{A}\alpha \\
\vdots \\
\boldsymbol{A}^{k-1}\alpha
\end{bmatrix}.\]
$M$ 是不变子空间，故 $\alpha,\boldsymbol{A}\alpha,\dots,\boldsymbol{A}^{k-1}\alpha\in M$ ，由上式得出 $\alpha _ i\in M,\, \alpha _ i\in V _ {\lambda _ i}\cap M=N _ i$ .

现在已得到 $M=N _ {\lambda _ 1}\oplus N _ {\lambda _ 2}\oplus\dots\oplus N _ {\lambda _ k}$ ，在每个 $N _ i$ 中取一组基，因 $N _ i\in V _ {\lambda _ i}$ ，这组基的向量全是特征向量，它们合并成 $M$ 的一组基，在此组基下 $\boldsymbol{A}| _ M$ 的矩阵即为对角形.

Theorem 51. 线性空间中

\alpha

为非零向量，则存在正整数

k

使得

\alpha,\boldsymbol{A}\alpha,\dots,\boldsymbol{A}^{k-1}\alpha

线性无关，而

\boldsymbol{A}^k \alpha

可被它们线性表示.如令

M=L(\alpha,\boldsymbol{A}\alpha,\dots,\boldsymbol{A}^{k-1}\alpha)

，那么

M

就是不变子空间，进一步，可以得到

\boldsymbol{A}| _ M

的特征多项式：
\begin{align*}
& \boldsymbol{A}^k\alpha=a _ 0\alpha+a _ 1\boldsymbol{A}\alpha+\dots+a _ {k-1}\boldsymbol{A}^{k-1}\alpha \\
\Longrightarrow{} & f(\lambda)=\lambda^k-a _ {k-1}\lambda^{k-1}-\dots-a _ 1\lambda-a _ 0.
\end{align*}

证：考察向量组 $\alpha,\boldsymbol{A}\alpha,\dots,\boldsymbol{A}^n\alpha$ ，有 $n+1$ 个向量，必线性相关，故必存在最小正整数 $k$ 使 $\boldsymbol{A}^k\alpha=a _ 0\alpha+a _ 1\boldsymbol{A}\alpha+\dots+a _ {k-1}\boldsymbol{A}^{k-1}\alpha$ ，同时 $\alpha,\boldsymbol{A}\alpha,\dots,\boldsymbol{A}^{k-1}\alpha$ 线性无关（否则同理会得到更小的 $k$ ，与已得的最小性矛盾）.显然 $M$ 是不变子空间， $\boldsymbol{A}| _ M$ 在基 $\alpha,\boldsymbol{A}\alpha,\dots,\boldsymbol{A}^{k-1}\alpha$ 下的矩阵及特征多项式为
\[J=\begin{bmatrix}
0 & 0 & 0 & \cdots & \cdots & a _ 0 \\
1 & 0 & 0 & \cdots & \cdots & a _ 1 \\
0 & 1 & 0 & \cdots & \cdots & a _ 2 \\
\vdots & \vdots & \ddots & \ddots & & \vdots \\
0 & 0 & 0 & \ddots & 0 & a _ {k-2} \\
0 & 0 & 0 & \cdots & 1 & a _ {k-1}
\end{bmatrix},f(\lambda)=
\begin{vmatrix}
\lambda & 0 & 0 & \cdots & \cdots & -a _ 0 \\
-1 & \lambda & 0 & \cdots & \cdots & -a _ 1 \\
0 & -1 & \lambda & \cdots & \cdots & -a _ 2 \\
\vdots & \vdots & \ddots & \ddots & & \vdots \\
0 & 0 & 0 & \ddots & \lambda & -a _ {k-2} \\
0 & 0 & 0 & \cdots & -1 & \lambda-a _ {k-1}
\end{vmatrix}.\]

$f(\lambda)=D _ k$ 按第一行展开得
\begin{align*}
D _ k & =\lambda D _ {k-1}-a _ 0=\lambda(\lambda D _ {k-2}-a _ 1)-a _ 0=\lambda^2 D _ {k-2}-a _ 1\lambda-a _ 0 \\
& =\lambda^2(\lambda D _ {k-3}-a _ 2)-a _ 1\lambda-a _ 0=\lambda^3 D _ {k-3}-a _ 2\lambda^2-a _ 1\lambda-a _ 0\\
& =\dots=\lambda^{k-1}D _ 1-a _ {k-2}\lambda^{k-2}-\dots-a _ 1\lambda-a _ 0\\
& =\lambda^{k-1}(\lambda-a _ {k-1})-a _ {k-2}\lambda^{k-2}-\dots-a _ 1\lambda-a _ 0\\
& =\lambda^k-a _ {k-1}\lambda^{k-1}-\dots-a _ 1\lambda-a _ 0.
\end{align*}
6.5. 商空间中的诱导变换上一段利用空间分解研究线性变换，本段利用商空间研究线性变换.

商空间中的诱导变换是指 $\boldsymbol{A}\overline{\alpha}=\overline{\boldsymbol{A}\alpha}$ .这样的定义是根据如下事实：对线性变换 $\boldsymbol{A}$ 若 $\alpha\equiv\beta\Rightarrow \boldsymbol{A}\alpha\equiv\boldsymbol{A}\beta$ .这是因为，设 $\alpha=\beta+m\Rightarrow \boldsymbol{A}\alpha=\boldsymbol{A}\beta+\boldsymbol{A}m=\boldsymbol{A}\beta+m^\prime$ .这就保证了当 $\overline{\alpha}=\overline{\beta}$ 时必有 $\overline{\boldsymbol{A}\alpha}=\overline{\boldsymbol{A}\beta}$ ，从而定义在逻辑上无矛盾.进一步可证明它是线性变换.

$\boldsymbol{A}\overline{\alpha}=\overline{\boldsymbol{A}\alpha}$ 可以写成 $\boldsymbol{A}\varphi(\alpha)=\varphi(\boldsymbol{A}\alpha)$ .

$\boldsymbol{A}(k\overline{\alpha}+l\overline{\beta})=\boldsymbol{A}(\overline{k\alpha+l\beta})=\overline{\boldsymbol{A}(k\alpha+l\beta)}=\overline{k\boldsymbol{A}\alpha+l\boldsymbol{A}\beta}=k\overline{\boldsymbol{A}\alpha}+l\overline{\boldsymbol{A}\beta}=k\boldsymbol{A}\overline{\alpha}+l\boldsymbol{A}\overline{\beta}$ .

诱导变换的引入有利于在商空间的角度研究线性变换，因为线性变换能够作用于一个剩余类.

Theorem 52.

\boldsymbol{A}

在

V

内特征多项式为

f(\lambda)

，

\boldsymbol{A}| _ M

在

V

内的为

g(\lambda)

，

\boldsymbol{A}

在

V/M

内的为

h(\lambda)

，则

f(\lambda)=g(\lambda)h(\lambda)

Theorem 53 (哈密顿-凯莱（Hamilton–Cayley）). 设

\boldsymbol{A}

的特征多项式为

f(\lambda)

，则

f(A)=0

Proposition 54. 如果

\boldsymbol{A}

的特征多项式的根都属于

K

，则其矩阵可“上三角化”.

对定理theorem4410，在不变子空间 $M$ 内取一组基 $\varepsilon _ 1,\dots,\varepsilon _ r$ ，扩充成 $V$ 的一组基 $\varepsilon _ 1,\dots,\varepsilon _ n$ ，前面已指出 $\boldsymbol{A}$ 在这组基下的矩阵为
\[A=\begin{bmatrix}
A _ {11} & A _ {12} \\
0 & A _ {22}
\end{bmatrix}.\]

则
\[f(\lambda)=|\lambda E-A|=
\begin{vmatrix}
\lambda E-A _ {11} & -A _ {12} \\
0 & \lambda E-A _ {22}
\end{vmatrix}=|\lambda E-A _ {11}||\lambda E-A _ {22}|.\]

前面也指出 $\overline{\varepsilon} _ {r+1},\dots,\overline{\varepsilon} _ n$ 为 $V/M$ 的一组基.可以推导：诱导变换 $\boldsymbol{A}$ 在 $V/M$ 的这组基下，
\[(\boldsymbol{A}\overline{\varepsilon} _ {r+1},\dots,\boldsymbol{A}\overline{\varepsilon} _ n)=(\overline{\varepsilon} _ {r+1},\dots,\overline{\varepsilon} _ n)A _ {22}.\]
故 $h(\lambda)=|\lambda E-A _ {22}|$ .联系 $g(\lambda)=|\lambda E-A _ {11}|$ 即证.

下面先给出定理theorem4411的两个证明.

证明一：线性空间中 $\alpha$ 为非零向量，利用定理theorem44100，存在不变子空间 $M=L(\alpha,\boldsymbol{A}\alpha,\dots,\boldsymbol{A}^{k-1}\alpha)$ ，使 $\boldsymbol{A}$ 的特征多项式为 $g(\lambda)=\lambda^k-a _ {k-1}\lambda^{k-1}-\dots-a _ 1\lambda-a _ 0$ ，且有 $\boldsymbol{A} ^k\alpha=a _ 0\alpha+a _ 1\boldsymbol{A}\alpha+\dots+a _ {k-1}\boldsymbol{A}^{k-1}\alpha$ ，于是（利用定理theorem4410）
\[g(A)=A^k-a _ {k-1}A^{k-1}-\dots-a _ 1A-a _ 0E=0\Longrightarrow f(A)=g(A)h(A)=0.\]

证明二：记 $\lambda E-A$ 的伴随矩阵为 $T$ ，得 $(\lambda E-A)T=|\lambda E-A|E=f(\lambda)E$ ，将 $T$ 按各个元中 $\lambda$ 的次数分拆为 $n$ 个矩阵之和，并将各个矩阵中的 $\lambda$ 提出， $T=\lambda^{n-1}T _ {n-1}+\lambda^{n-2}T _ {n-2}+\dots+\lambda T _ 1+T _ 0$ ，
\begin{gather*}
f(\lambda)E=(\lambda^n+c _ {n-1}\lambda^{n-1}+\dots+c _ 1\lambda+c _ 0)E=\lambda^n E+c _ {n-1}\lambda^{n-1}E+\dots+c _ 1\lambda E+c _ 0 E \
\begin{split}
(\lambda E-A)T & =(\lambda E-A)\sum _ {i=0}^{n-1}\lambda^i T _ i=\sum _ {i=0}^{n-1}\lambda^{i+1}T _ i-\sum _ {i=0}^{n-1}\lambda^i AT _ i=\sum _ {i=1}^{n}\lambda^{i}T _ {i-1}-\sum _ {i=0}^{n-1}\lambda^i AT _ i \
& =\lambda^n T _ {n-1}+\sum _ {i=1}^{n-1}\lambda^{i}(T _ {i-1}-AT _ i)-AT _ 0
\end{split}
\end{gather*}

矩阵的 $n^2$ 个元都是关于 $\lambda$ 的多项式，由多项式恒等定理，每个元中 $\lambda$ 各项系数相等，每个次数的 $n^2$ 个方程又反过来得到了一个矩阵方程，且和直接对比对应项系数得到的方程一致，就有：
\begin{gather*}
T _ {n-1}=E,\; T _ {i-1}-AT _ i=c _ i E\, (1\leqslant i\leqslant n-1),\; -AT _ 0=c _ 0 E \
f(A)=A^n+c _ {n-1}A^{n-1}+\dots+c _ 1 A+c _ 0=A^n+\sum _ {i=1}^{n-1}(T _ {i-1}-AT _ i)A^{i}-AT _ 0=0.
\end{gather*}

对命题prop443，对线性空间的维数 $n$ 做数学归纳法.一维显然成立，设对 $n-1$ 维成立，当 $\dim V=n$ 时， $\boldsymbol{A}$ 必有一特征值 $\lambda$ ，设 $\boldsymbol{A}\varepsilon _ 0=\lambda\varepsilon _ 0,\; \varepsilon _ 0$ 非零，则 $M=L(\varepsilon _ 0)$ 为一维不变子空间， $V/M$ 为 $n-1$ 维线性空间，根据定理theorem4410，可知 $\boldsymbol{A}$ 在 $V/M$ 内特征多项式的根都属于 $K$ ，由归纳假设，在 $V/M$ 内存在一组基 $\overline{\varepsilon} _ 1,\dots,\overline{\varepsilon} _ {n-1}$ ，使 $\boldsymbol{A}$ 在这组基下的矩阵成上三角形，写出来就是 $\boldsymbol{A}\overline{\varepsilon} _ i=a _ {1i}\overline{\varepsilon} _ 1+\dots+a _ {ii}\overline{\varepsilon} _ i\, (i=1,2,\dots,n-1)$ .可以证 $\varepsilon _ 0,\varepsilon _ 1,\dots,\varepsilon _ {n-1}$ 是 $V$ 的一组基，只需它们线性无关.

设 $\sum k _ i\varepsilon _ i=0$ .利用自然映射以及 $\varphi(\varepsilon _ 0)=\overline{0},\, \varphi(\sum k _ i\varepsilon)=\sum k _ i\varphi(\varepsilon _ i)=k _ 1\overline{\varepsilon} _ 1+\dots+k _ {n-1}\overline{\varepsilon} _ {n-1}=\overline{0}$ .而 $\overline{\varepsilon} _ 1,\dots,\overline{\varepsilon} _ {n-1}$ 是商空间的一组基，故 $k _ 1=\dots=k _ {n-1}=0$ .代回原式，因 $\varepsilon _ 0$ 非零知 $k _ 0=0$ .

上面已有 $\boldsymbol{A}\overline{\varepsilon} _ i=a _ {1i}\overline{\varepsilon} _ 1+\dots+a _ {ii}\overline{\varepsilon} _ i\, (i=1,2,\dots,n-1)$ ，有 $\overline{\boldsymbol{A}\varepsilon _ i}=\overline{a _ {1i}\varepsilon _ 1+\dots+a _ {ii}\varepsilon _ i}$ .这说明 $\boldsymbol{A}\varepsilon _ i=k _ i\varepsilon _ 0+ a _ {1i}\varepsilon _ 1+\dots+a _ {ii}\varepsilon _ i$ ，于是 $\boldsymbol{A}$ 在基 $\varepsilon _ 0,\varepsilon _ 1,\dots,\varepsilon _ {n-1}$ 下的矩阵为
\[A=\begin{bmatrix}
\lambda & k _ 1 & k _ 2 & \cdots & k _ {n-1} \\
0 & a _ {11} & a _ {12} & \cdots & a _ {1,n-1} \\
0 & 0 & a _ {22} & \cdots & a _ {2,n-1} \\
\vdots & \vdots & \vdots & & \vdots \\
0 & 0 & 0 & \cdots & a _ {n-1,n-1}
\end{bmatrix}.\]

线性空间与线性变换

评论

发表回复取消回复

线性空间与线性变换

评论

发表回复 取消回复

发表回复取消回复