我的原文地址
第四章:线性空间与线性变换
1. 引言
第二章引进了向量空间与矩阵的概念,并阐明了它们在代数学上的地位:向量空间是一个最初等的代数系统,矩阵则代表K^n到K^m的一个保持加法、数乘运算的映射.这样,就摆脱了数及其四则运算的局限性,进入了一类不是由普通的数所构成的集合,在这个集合内研究不是普通数的运算的两种新的运算.但是这个转变还处在一个比较低的层次上.因为,向量空间中的元素虽然不是普通的数,却仍局限于多元有序数组,就是说只是从研究单个的数进到研究一组数.一说“向量”,就意味着一组具体的数,一说“加法”就是具体的分量相加,数乘就是数乘每个分量.如果仍停留在这个水平上,认识就还没提升到应有的高度.要从感性上升到理性,从具体上升到抽象,才会有理论上的实质进展,对该理论的认识才能深入,该领域的应用范围才能更加宽广.因此,关于向量空间和矩阵的认识还需要从理论上在提高一步.可以发觉,前面关于向量空间的概念及有关定理、它们的证明都不依赖于有序数组的具体表达式、加法和数乘的具体计算式.而只依赖于:向量间有加法、数乘,且满足八条运算法则.从中可以获得启发:可以把多元数组这一具体表达形式与加法、数乘的具体计算式这些非本质的东西抛弃,只把最根本的八条运算法则保留下来,当作“公理”加以承认.这样就形成了本章的核心概念,也是线性代数的基本研究对象:线性空间.
矩阵是向量空间之间保持加法数乘运算的映射,现在已经把向量空间提升为抽象的线性空间,那么矩阵也相应地被提升为线性空间之间保持向量加法、数乘的映射,及线性空间之间的线性映射,特别是一个线性空间到自身的线性变换.这是本章的第二个核心概念.
Contents
Contents
1. 引言
2. 总括
3. 线性空间的基本概念
3.1. 线性空间的定义
3.2. 线性空间的基本属性
3.3. 基和维数
3.4. 向量的坐标
3.5. 基变换与坐标变换
3.5.1. 线性空间中的基变换
3.5.2. 线性空间中的坐标变换
4. 子空间与商空间
4.1. 子空间的基本概念
4.2. 子空间的交与和
4.3. 子空间的直和
4.4. 商空间
5. 线性映射与线性变换
5.1. 线性映射
5.2. 线性空间的同构
5.3. 线性映射的核、像集、余核
5.4. 线性映射的矩阵
5.5. 线性变换的基本概念
5.6. 线性变换在不同基下的矩阵
6. 线性变换的特征值与特征向量
6.1. 特征值与特征向量的定义
6.2. 特征多项式的基本性质
6.3. 具有对角形矩阵的线性变换
6.4. 不变子空间
6.5. 商空间中的诱导变换
2. 总括
线性代数的核心内容是研究线性空间和它们之间的线性映射,特别是线性空间自身的线性变换的理论.线性空间是一种最初等、最基本的代数系统,但在它的基本理论中充分体现了代数学的基本思想与基本方法.下面几个方面值得注意:
- 线性空间的运算是以抽象形式出现的,线性空间的全部理论则以这些运算满足的八条(实际上是七条)公理为立足点.它用这概括了相当广泛的一类客观事物的共性,因而又具有广泛的应用领域.这一特点是代数学各分支共有的.
- 研究线性空间的基本方法有两种,一是进行空间分解,研究各种子空间,二是从总体上提升一步研究商空间.这是研究各种代数系统共通的方法.
- 抽象与具体紧密结合,先从线性方程组入手形成向量空间和矩阵,再舍弃其具体的躯壳形成线性空间和线性变换的一般理论,从而能站在更高的理论层次上将问题看得更深更透,而且更直观.所以,当从理论上处理问题时,从线性空间和线性变换的观点来处理较为合适.而当需要做具体计算时,又要把抽象问题在具体化.从具体到抽象,又从抽象回到具体,也是代数学各领域普遍适用的方法.
- 线性空间虽为最简单的代数系统,又有其它代数系统一般不具备的特殊性质,就是有线性相关与线性无关的概念,有它产生了基和维数这一核心概念.它使我们有可能把对线性空间中无限多向量的研究归结为有限多个向量(一组基)的研究.吧线性映射(变换)归结为一组基处的作用,从而与矩阵建立起紧密的联系.从中再引导出基变换关系及矩阵的相似关系,后者又产生出特征值、特征向量这一重要理论.
(i)在V中定义了一种运算,称为加法.即对任意\alpha,\, \beta\in V,都按某一法则对应于V内唯一确定的一个元素,记为\alpha+\beta;
(ii)在K中的数与V中的元素间定义了一种运算,称为数乘.即对任意k\in K,\, \alpha\in V,都按某一法则对应于V内唯一确定的一个元素,记之为k\alpha.
则称V是K上的线性空间,如果加法与数乘满足如下八条运算法则:
- \forall\, \alpha,\beta,\gamma\in V,\, \alpha+(\beta+\gamma)=(\alpha+\beta)+\gamma;
- \forall\, \alpha,\beta\in V,\, \alpha+\beta=\beta+\alpha;
- \exists\, 0\in V,\, \mathrm{s.t.}\forall\, \alpha\in V,\, \alpha+0=\alpha;
- \forall\, \alpha\in V,\, \exists\, \beta\in V,\, \mathrm{s.t.}\, \alpha+\beta=0;
- 1\cdot\alpha=\alpha;
- \forall\, k,l\in K,\alpha\in V,\, (kl)\alpha=k(l\alpha);
- \forall\, k,l\in K,\alpha\in V,\, (k+l)\alpha=k\alpha+l\alpha;
- \forall\, k\in K,\alpha,\beta\in V,\, k(\alpha+\beta)=k\alpha+k\beta.
事实上,在定义中加法交换律是多余的(但为了叙述简洁,一般把它当做公理列入),因为它可以由其它七条推出:
先证0\alpha=0.设0\alpha+\beta=0.
\begin{align*}
0\alpha= & 0\alpha+0=0\alpha+(0\alpha+\beta)=(0\alpha+0\alpha)+\beta \\
& =(0+0)\alpha+\beta=0\alpha+\beta=0.
\end{align*}
再证\alpha+(-1)\alpha=0.\, \alpha+(-1)\alpha=1\cdot\alpha+(-1)\alpha=0\alpha=0.
再证\alpha+\beta=0\Rightarrow\beta+\alpha=0.设\beta+\gamma=0.
\begin{align*}
\beta+\alpha & =(\beta+\alpha)+0=(\beta+\alpha)+(\beta+\gamma)=((\beta+\alpha)+\beta)+\gamma \\
& =(\beta+(\alpha+\beta))+\gamma=(\beta+0)+\gamma=\beta+\gamma=0.
\end{align*}
再证0+\alpha=\alpha.设\alpha+\beta=0,则\beta+\alpha=0.\, 0+\alpha=(\alpha+\beta)+\alpha=\alpha+(\beta+\alpha)=\alpha+0=0.
设\alpha+\beta=0,
\begin{align*}
\beta+\alpha & =0+(\beta+\alpha)=((\alpha+\beta)+(-1)(\alpha+\beta))+(\beta+\alpha) \\
& =(\alpha+\beta)+((-1)\alpha+(-1)\beta)+(\beta+\alpha)=(\alpha+\beta)+((-1)\alpha+((-1)\beta+\beta)+\alpha)\\
& =(\alpha+\beta)+((-1)\alpha+0+\alpha)=(\alpha+\beta)+((-1)\alpha+\alpha)=(\alpha+\beta)+0=\alpha+\beta.\\
\end{align*}
3.2. 线性空间的基本属性
V内的加法和数乘都是以抽象的形式给出来的,可能跟熟悉的数或向量空间中的向量的加法和数乘相去甚远,因此一些习以为常的事实,都需要从逻辑上加以证明以确认其正确性.
- 零向量唯一.
- 负向量唯一.
- 加法有消去率.
- 加法可移项.
- 0\cdot\alpha=0;\, (-1)\alpha=-\alpha;\, k\cdot0=0.
- k\alpha=0,\, k\neq0\Longrightarrow\alpha=\dfrac1k\beta.
- 任意n个线性无关向量都是它的一组基;
- 它的任意一组基一定恰好含n个向量.
在n维线性空间中,任意n+1个向量都是线性相关的,所以最多只有n个线性无关的向量.
证:任意n个线性无关向量,加上V任意一个向量后有n+1个向量,能被n个向量的向量组表示,由定理theorem213,它们线性相关,故后加的向量能被原给的n个线性无关向量线性表示,故这n个线性无关向量构成一组基.
任意一组基,它与含n个向量的基等价,由theorem214,二者秩相等,又都线性无关,故都含n个向量.
3.4. 向量的坐标
设\alpha,\beta在一组取定的基下的坐标表示式为
\begin{gather*}
\alpha=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)\begin{bmatrix}
a_1\\a_2\\ \vdots\\a_n
\end{bmatrix},\beta=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)\begin{bmatrix}
b_1\\b_2\\ \vdots\\b_n
\end{bmatrix}. \\
\Longrightarrow\alpha+\beta=(a_1+b_1)\varepsilon_1+\dots+(a_n+b_n)\varepsilon_n=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)\begin{bmatrix}
a_1+b_1\\a_2+b_2\\ \vdots\\a_n+b_n
\end{bmatrix}.\\
k\alpha=ka_1\alpha_1+ka_2\alpha_2+\dots+ka_n\alpha_n=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)\begin{bmatrix}
ka_1\\ka_2\\ \vdots\\ka_n
\end{bmatrix}.
\end{gather*}
\alpha的坐标可看作K^n中一个向量,V中两个向量相加对应于它们在K^n中的坐标相加,V中向量的数乘对应于它们在K^n中的坐标向量作数乘.这样就把V中向量的抽象加法、数乘运算具体化为它们的坐标作为K^n中向量按K^n具体的向量加法、数乘作运算.这就是说,在V中取定一组基后,又把抽象还原为了具体.
3.5. 基变换与坐标变换
显然有一个问题需要解决:
给定两组基\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n;\, \eta_1,\eta_2,\dots,\eta_n.基变换公式:
\[(\eta_1,\eta_2,\dots,\eta_n)=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)T.\]
\begin{gather*}
(\eta_1,\eta_2,\dots,\eta_n)=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)T, \
T=\begin{bmatrix}
t_{11}&t_{12}&\cdots&t_{1n}\\
t_{21}&t_{22}&\cdots&t_{2n}\\
\vdots&\vdots& &\vdots\\
t_{n1}&t_{n2}&\cdots&t_{nn}
\end{bmatrix}.
\end{gather*}
\[\eta_1,\eta_2,\dots,\eta_n\, \text{是一组基}\Longleftrightarrow T\, \text{可逆}.\]
两组基间的过渡矩阵可逆,反过来从给定的一组基出发借助某一可逆矩阵就可获得一组新的基.
证:设T列向量组为T_1,T_2,\dots T_n.\, \eta_1,\eta_2,\dots,\eta_n是一组基的充要条件是\eta_1,\eta_2,\dots,\eta_n线性无关,由theorem412,这等价于T_1,T_2,\dots T_n线性无关等价于T满秩或可逆.
3.5.2. 线性空间中的坐标变换
令\alpha=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)X=(\eta_1,\eta_2,\dots,\eta_n)Y,坐标变换公式:
\[X=TY.\]
这是因为\alpha=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)X=[(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)T]Y=
(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)(TY).
4. 子空间与商空间
下面主要从两个方面把对线性空间的研讨深入下去.第一方面,是深入探讨其内部结构,即下面阐述的子空间.另一方面,为从整体上更清晰地俯瞰一个线性空间的总体情况,又常常需要隐去其内部细节,就形成商空间的概念.这两种深入研究线性空间的方法,是代数学各领域所普遍使用的.
4.1. 子空间的基本概念
对定理theorem421,只要推出零向量仍属于M,M内向量的负元素也仍在M中,那么线性空间定义的八条性质就都具备.这是显然的:乘法封闭有0\alpha=0\in M,\, (-1)\alpha=-\alpha\in M.
对定理theorem422,M显然是有限维的,设\dim M=r,一组基为\varepsilon_1,\dots,\varepsilon_r,则M=L(\varepsilon_1,\dots,\varepsilon_r).如果M=V,则已有V的基.如果M\neq V,则存在\varepsilon_{r+1}\in V\backslash M,可以证明\varepsilon_1,\dots,\varepsilon_r,\varepsilon_{r+1}线性无关.如果L(\varepsilon_1,\dots,\varepsilon_r,\varepsilon_{r+1})\neq V,继续上述步骤,经n-r次步骤,得到n个线性无关的向量,由定理theorem411,它们组成一组基.
4.2. 子空间的交与和
子空间M_1,M_2都含0,故显然有M_1,M_2\subseteq M_1+M_2.值得注意的是一般情况下M_1+M_2\neq M_1\cup M_2.
证:下面对维数公式进行推导.
取M_1\cap M_2的一组基\varepsilon_1,\dots,\varepsilon_r.它可以扩充成M_1的一组基\varepsilon_1,\dots,\varepsilon_r,\alpha_1,\dots,\alpha_s,也可以扩充成M_2的一组基\varepsilon_1,\dots,\varepsilon_r,\beta_1,\dots,\beta_t.只需证明\varepsilon_1,\dots,\varepsilon_r,\alpha_1,\dots,\alpha_s,\beta_1,\dots,\beta_t是M_1+M_2的一组基.
显然\alpha\in M_1+M_2可被上述向量组线性表示,只需证其线性无关.设
\[k_1\varepsilon_1+\dots+k_r\varepsilon_r+a_1\alpha_1+\dots+a_s\alpha_s+b_1\beta_1+\dots+b_t\beta_t=0.\]
这可写成
\[\gamma=k_1\varepsilon_1+\dots+k_r\varepsilon_r+a_1\alpha_1+\dots+a_s\alpha_s=-(b_1\beta_1+\dots+b_t\beta_t).\]
故\gamma\in M_1\cap M_2,可被\varepsilon_1,\dots,\varepsilon_r线性表示:
\begin{gather*}
\gamma=c_1\varepsilon_1+\dots+c_r\varepsilon_r=-(b_1\beta_1+\dots+b_t\beta_t) \
\begin{split}
&\, c_1\varepsilon_1+\dots+c_r\varepsilon_r+b_1\beta_1+\dots+b_t\beta_t=0 \
\Longrightarrow&\, c_1=\dots=c_r=b_1=\dots=b_t=0.\
\Longrightarrow&\, k_1\varepsilon_1+\dots+k_r\varepsilon_r+a_1\alpha_1+\dots+a_s\alpha_s=0\
\Longrightarrow&\, k_1=\dots=k_r=a_1=\dots=a_s=b_1=\dots=b_t=0.
\end{split}
\end{gather*}
M_1,M_2,\dots,M_s\neq V.
这说明了和子空间的和相比,子空间的并的局限性,真子空间的和完全有可能等
于V.
证:下面分两种情况.若V为有限维,设维数为n,令
\alpha_i=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)(1,i,\dots,i^{n-1})^{\mathrm{T}},
由范德蒙行列式知诸\alpha_i任选n个的坐标都线性无关,由定理
theorem412,这n个向量线性无关,于是它们构成V的一组基,因此每
个M_i中至多包含n-1个向量,故必有一个\alpha_i不包含在M_i中.
对一般情况,只需找到V中一个向量不包含在任一M_i中.对s作归纳法.\,
s=1时显然.现设s=m时成立,对s=m+1,取\alpha\notin M_1\cup
M_2\cup\dots\cup M_m,若\alpha\in M_{m+1},则已找出.若\alpha\in
M_{m+1},取\beta\notin M_1\cup M_2\cup\dots\cup M_m,若\beta\in
M_{1},则已找出.若\beta\notin M_1,考察\alpha,\beta的线性组合,显
然其线性组合(系数不为零)不属于M_1或M_{m+1},我们找出一种线性组合使其也不属于
M_2,\dots,M_m,将线性组合“标准化”为\alpha+k\beta(k\neq0),若
\alpha+k\beta,\alpha+l\beta\in M_i\Rightarrow(k-l)\beta\in
M_i\Rightarrow k=l,故至多有一个k_i使\alpha+k_i\beta\in M_i,而
K内包含无穷多个数,故必存在K内非零数k使\alpha+k\beta\notin
M_1,M_2,\dots,M_{m+1},即证.
对一般的证明,主要使用线性空间的基本性质构造出所需要的向量,其中主要是
依赖于数域内包含无穷多个数这个事实,如无此事实,则结论不成立.
4.3. 子空间的直和
&\, M_1+M_2\, \text{是直和} \\
\Longleftrightarrow &\, 0\, \text{向量表法唯一}\\
\Longleftrightarrow &\, M_1\cap M_2=\{0\}\\
\Longleftrightarrow &\, \dim M_1+\dim M_2=\dim(M_1+M_2).
\end{align*}
&\, M_1+M_2+\dots+M_k\, \text{是直和} \\
\Longleftrightarrow &\, 0\, \text{向量表法唯一}\\
\Longleftrightarrow &\, M_i\cap \Big(\sum_{\substack{j=1\\j\neq i}}^k M_j\Big)=\{0\}\; (i\, \text{遍历}1\text{到}k)\\
\Longleftrightarrow &\, \dim\sum_{i=1}^k M_i=\sum_{i=1}^k \dim M_i.
\end{align*}
在每个M_i内取一组基,合并后得到V的一组基.
\[V=M\oplus N.\]
对定理theorem425,双向证之.若M_1+M_2是直和,0向量表法当然唯一,任取\beta\in M_1\cap M_2,则0可表为0=\beta+(-\beta)\Rightarrow \beta=0\Rightarrow M_1\cap M_2=\{0\}.反之若M_1\cap M_2=\{0\},\, \alpha=\alpha_1+\alpha_2=\alpha^\prime _1+\alpha^\prime _2\Rightarrow \alpha_1-\alpha^\prime _1=-(\alpha_2-\alpha^\prime _2)\in M_1\cap M_2=\{0\}\Rightarrow \alpha 表法唯一.
对定理theorem426,类似.若M_1+M_2+\dots+M_k是直和,0向量表法当然唯一.设\beta,-\beta\in M_i\cap\bigl(\sum_{j\neq i}M_j\bigr),则
0=\beta+(-\beta)=\alpha_1+\dots+\alpha_{i-1}+(-\beta)+\alpha_{i+1}+\dots+\alpha_k\Longrightarrow\beta=0\Longrightarrow交集是零空间.
当k=2时由维数公式,下面的命题成立:
\[M_i\cap \Big(\sum_{\substack{j=1\\j\neq i}}^k M_j\Big)=\{0\}\; (i\, \text{遍历}1\text{到}n)\Longrightarrow\dim\sum_{i=1}^k M_i=\sum_{i=1}^k \dim M_i.\]
设该命题对k-1个子空间成立,对任一j\geqslant2,
\[M_j\cap\Big(\sum_{\substack{s=2\\s\neq j}}^k M_s\Big)\subseteq M_j\cap\Big(\sum_{\substack{s=1\\s\neq j}}^k M_s\Big)=\{0\}\Longrightarrow\dim\sum_{j=2}^k M_j=\sum_{j=2}^k \dim M_j.\]
那么,
\[M_1\cap\Big(\sum_{j=2}^k M_j=\{0\}\Big)\Longrightarrow\dim\sum_{i=1}^k M_i=\dim M_1+\dim\sum_{j=2}^k M_j=\sum_{i=1}^k \dim M_i.\]
反过来,对任一i,
\begin{align*}
& \dim\sum_{i=1}^k M_i=\sum_{i=1}^k \dim M_i \\
\Longrightarrow{} & \mathrel{\phantom{=}}\dim\biggl(M_i\cap\Bigl(\sum_{\substack{j=1\\j\neq i}}^k M_j\Bigr)\biggr)=\dim M_i+\dim\sum_{\substack{j=1\\j\neq i}}^k M_j-\dim\sum_{j=1}^k M_j\\
& \leqslant\dim M_i+\sum_{\substack{j=1\\j\neq i}}^k\dim M_j-\dim\sum_{j=1}^k M_j \\
& =\sum_{j=1}^k\dim M_j-\dim\sum_{j=1}^k M_j=0\\
\Longrightarrow{} & M_i\cap \Big(\sum_{\substack{j=1\\j\neq i}}^k M_j\Big)=\{0\}.
\end{align*}
下面证明任一\alpha\in\sum M_i表法唯一.令\alpha=\alpha_1+\dots+\alpha_k=\alpha^\prime_1+\dots+\alpha^\prime_k.对任一i,
\[\alpha_i-\alpha^\prime_i=(\alpha^\prime_1-\alpha_1)+\dots+(\alpha^\prime_{i-1}-\alpha_{i-1})+(\alpha^\prime_{i+1}-\alpha_{i+1})+\dots+(\alpha^\prime_k-\alpha_k)\in M_i\cap \Big(\sum_{\substack{j=1\\j\neq i}}^k M_j\Big)=\{0\}.\]
对于定理theorem427,M=\{0\}时取N=V.若M\neq\{0\},令
M=L(\varepsilon_1,\dots,\varepsilon_r),这组基可扩充成V的一组基
\varepsilon_1,\dots,\varepsilon_r,\varepsilon_{r+1},\dots,\varepsilon_n.令
N=L(\varepsilon_{r+1},\dots,\varepsilon_n),则V=M+N,且\dim
V=\dim M+\dim N,故V=M\oplus N.
对定理theorem426,略作改进,可得到某些情况下用起来较方便的如下命题:
必要性由定理theorem426显然成立,对充分性,若不是直和,则0表法
不唯一,设0=\sum \alpha_{i},此时至少有两个不为0,设自右至左第一个
非0的是\alpha_i,则i\geqslant2,且
\[-\alpha_{i}=\alpha_1+\alpha_2+\dots+\alpha_{i-1}\in M_i\cap\Big(\sum_{j=1}^{i-1} M_j\Big)=\{0\}\Longrightarrow\alpha_i=0,\]
矛盾.
4.4. 商空间
关于模M的同余类有如下简单性质:
- \alpha^\prime \equiv\alpha\Longleftrightarrow\alpha^\prime -\alpha\in M\Longleftrightarrow\alpha^\prime \in \alpha+M\Longleftrightarrow\alpha^\prime +M=\alpha+M;
- \alpha+M=0+M\Longleftrightarrow\alpha\in M;
- \alpha^\prime +M\neq \alpha+M\Longrightarrow(\alpha^\prime +M)\cap(\alpha+M)=\varnothing.
可以证明若\alpha^\prime \in \alpha+M,则\alpha^\prime +M\subseteq\alpha+M,\, \alpha+M\subseteq\alpha^\prime +M.若\alpha^\prime +M=\alpha+M,取一元素\beta,则\beta=\alpha^\prime +m_1=\alpha+m_2\Rightarrow\alpha^\prime =\alpha+(m_2-m_1)\Rightarrow\alpha^\prime \in \alpha+M.若存在\beta\in(\alpha^\prime +M)\cap(\alpha+M),有\alpha^\prime +M=\beta+M=\alpha+M.
证:在M内取一组基\varepsilon_1,\dots,\varepsilon_m,扩充为V的一组基\varepsilon_1,\dots,\varepsilon_n,下证\overline{\varepsilon}_{m+1},\dots,\overline{\varepsilon}_n是V/M的一组基.
先证线性无关.
\begin{align*}
& k _ {m+1}\overline{\varepsilon} _ {m+1}+\dots+k _ n\overline{\varepsilon} _ n=\overline{0}. \\
\Longrightarrow{} & \overline{k _ {m+1}\varepsilon _ {m+1}+\dots+k _ n\varepsilon _ n}=\overline{0}=0+M\\
\Longrightarrow{} & k _ {m+1}\varepsilon _ {m+1}+\dots+k _ n\varepsilon _ n\in M\\
\Longrightarrow{} & k _ {m+1}\varepsilon _ {m+1}+\dots+k _ n\varepsilon _ n=k _ 1\varepsilon _ 1+\dots+k _ m\varepsilon _ m\\
\Longrightarrow{} & k _ {m+1}=\dots=k _ n=0.
\end{align*}
再证\overline{\alpha}可被\overline{\varepsilon} _ {m+1},\dots,\overline{\varepsilon} _ n线性表示.注意到\varepsilon _ i\in M\left(i=1,2,\dots,m\right),\, \overline{\varepsilon}=\overline{0},
\begin{align*}
\overline{\alpha} & =\overline{k _ 1\varepsilon _ 1+\dots+k _ m\varepsilon _ m+k _ {m+1}\varepsilon _ {m+1}+\dots+k _ n\varepsilon _ n} \\
& =k _ 1\overline{\varepsilon} _ 1+\dots+k _ m\overline{\varepsilon} _ m+k _ {m+1}\overline{\varepsilon} _ {m+1}+\dots+k _ n\overline{\varepsilon _ n}\\
& =k _ {m+1}\overline{\varepsilon} _ {m+1}+\dots+k _ n\overline{\varepsilon _ n}.
\end{align*}
5. 线性映射与线性变换
5.1. 线性映射
件是f(\alpha_1),\dots,f(\alpha_l)线性无关.
\varepsilon_1,\dots,\varepsilon_n,\,
f(\varepsilon_1),\dots,f(\varepsilon_n)是V的一组基,从而\dim V=\dim
U.
对定理theorem431,若f(\alpha_1),\dots,f(\alpha_l)线性无关,可
不依赖f为单射推出\alpha_1,\dots,\alpha_l线性无关.设
k_1\alpha_1+\dots+k_l\alpha_l=0,则
k_1f(\alpha_1)+\dots+k_lf(\alpha_l)=0\Rightarrow k_1=\dots=k_l=0.
设\alpha_1,\dots,\alpha_l线性无关,k_1f(\alpha_1)+\dots+k_lf(\alpha_l)=f(k_1\alpha_1+\dots+k_l\alpha_l)=0.
由单射知k_1\alpha_1+\dots+k_l\alpha_l=0\Rightarrow k_1=\dots=k_l=0.
对定理theorem432,由上一个定理知f(\alpha_1),\dots,f(\alpha_l)
线性无关.\, \forall\, \beta\in V,\, \exists\, \alpha\in U,\, \mathrm{s.t.}\, f(\alpha)=\beta,设\alpha=\sum k_i\alpha_i\Rightarrow\beta=\sum
k_if(\alpha_i),由此知f(\varepsilon_1),\dots,f(\varepsilon_n)是V的一组基.
5.2. 线性空间的同构
线性空间的同构关系是一种等价关系.如果U是n维线性空间,那么由定理theorem432,所有与U同构的线性空间也都是n维线性空间.反过来,如果U,V都是n维线性空间,那么由它们都与K^n同构,知U与V同构.
5.3. 线性映射的核、像集、余核
- [(i)]
- \ker f是U的子空间,且f为单射的充分必要条件是\ker f=\{0\}.
- \mathrm{im}f是U的子空间,且f为满射的充分必要条件是\mathrm{coker}f=\{0\}.
设\varphi为V到V/M的自然映射,不难看出,有\ker \varphi=M,\, \mathrm{im}\varphi=V/M.
对定理theorem433,不难得知\ker f,\mathrm{im}f均是U的子空间.\, f为单射时显然\ker f=\{0\}.反过来若\ker f=\{0\},\, f(\alpha)=f(\beta)\Rightarrow f(\alpha-\beta)=0\Rightarrow\alpha-\beta\in\ker f=\{0\}\Rightarrow\alpha=\beta,于是f为单射.而f为满射等价于\mathrm{im}f=V,等价于\mathrm{coker}f=V/\mathrm{im}f=\{0\}.
对定理theorem434,下面的逻辑推理似乎会有些抽象,但其直观意义其实很简单明白:U在¥f下映为V内同一个向量的全体向量是U的一个子集,并且可以知道是\alpha+\ker f.如果把这些子集每一个当作一个单一元素,它们合并成为一个新集合,那么f就成了这个新集合到V的一一对应,变得较为单纯.而这个新集合就是商空间U/\ker f\, f正好诱导出U/\ker f到V的线性空间同构.
取映射\tau(\alpha+\ker f)=f(\alpha)\in\mathrm{im}f,可以证明\tau为U/\ker f到\mathrm{im}f的同构映射.
用记号\overline{\alpha}=\alpha+\ker f.首先\tau的定义在逻辑上无矛盾,即\alpha+\ker f=\beta+\ker f时\tau(\overline{\alpha})=\tau(\overline{\beta}).此时\beta=\alpha+m,\, m\in\ker f.于是f(\beta)=f(\alpha)+f(m)=f(\alpha)\Rightarrow\tau(\overline{\alpha})=f(\alpha)=f(\beta)=\tau(\overline{\beta}).
\tau是线性映射.事实上,\tau(k\overline{\alpha}+l\overline{\beta})=\tau(\overline{k\alpha+l\beta})=f(k\alpha+l\beta)=kf(\alpha)+lf(\beta)
=k\tau(\overline{\alpha})+l\tau(\overline{\beta}).
\tau是单射.设\tau(\overline{\alpha})=\tau(\overline{\beta})\Rightarrow f(\alpha)=f(\beta)\Rightarrow f(\alpha-\beta)=0\Rightarrow \alpha-\beta\in\ker f\Rightarrow\alpha+\ker f=\beta+\ker f.
\tau显然是满射,故\tau是U/\ker f到\mathrm{im}f的同构映射.
f给出了U到\mathrm{im}f的映射,\varphi给出了U到U/\ker f的映射,而\tau则是\ker f到\mathrm{im}f的映射,事实上,
\[\tau\varphi(\alpha)=\tau(\overline{\alpha})=f(\alpha)\Longleftrightarrow f=\tau\circ\varphi.\]
上述满足条件的同构映射\tau也是唯一的.若\tau^\prime也使f=\tau^\prime \circ\varphi,则\tau^\prime (\overline{\alpha})=f(\alpha)=\varphi(\overline{\alpha})\Rightarrow\tau^\prime =\tau.
给定m\times n矩阵A,\, A给出了K^n到K^m的一个保持加法、数乘运算的映射,亦即线性映射:f_A(X)=AX.现在,\ker A是齐次线性方程组AX=0的解空间.设A的列向量组为\alpha_1,\dots,\alpha_n,对K^n的坐标向量X_j有f_A(X_j)=\alpha_j,而K^n=L(X_1,\dots,X_n),故\mathrm{im}f_A=L(\alpha_1,\dots,\alpha_n),也就是说\mathrm{im}f_A是A的列向量组生成的线性空间.
线性方程组AX=B有解的充分必要条件是B\in L(\alpha_1,\dots,\alpha_n)\Leftrightarrow B\in\mathrm{im}f_A.而\mathrm{coker}f_A=K^m/L(\alpha_1,\dots,\alpha_n)成了AX=B有解的一个量度.
利用推论tuilun431,\dim\mathrm{im}f_A=r(A)=r,\, \dim \ker f_A=\dim K^n-\dim\mathrm{im}f_A=n-r.这是第二章已经得到的定理.
5.4. 线性映射的矩阵
把矩阵提升为一般的线性映射是理论上的一大进步,对许多问题的认识也大大深入.另一方面,当面临需要对某些问题作具体技术时,又要把抽象的线性映射具体化为矩阵.
- [(i)]
- f\in\hom(U,V)由f(\varepsilon_1),\dots,f(\varepsilon_n)唯一决定,
- 任给V内n个向量\alpha_1,\dots,\alpha_n,确定了唯一的f\in\hom(U,V),使f(\varepsilon_i)=\alpha_i.
称A为线性映射f在给定基下的矩阵.
对定理theorem435,如果f(\varepsilon_i)\equiv g(\varepsilon_i),设\alpha=\sum x_i\varepsilon_i\Rightarrow f(\alpha)=\sum x_if(\varepsilon_i)=\sum x_ig(\varepsilon_i)=g(\alpha).对U内一向量\alpha=(\varepsilon_1,\dots,\varepsilon_n)X,令f(\alpha)=f((\varepsilon_1,\dots,\varepsilon_n)X)=(\alpha_1,\dots,\alpha_n)X(这里的构造其实是利用形式结合律给出),可以看出f\in\hom(U,V).又设\beta=(\varepsilon_1,\dots,\varepsilon_n)Y,
\begin{align*}
f(k\alpha+l\beta){} & =f((\varepsilon_1,\dots,\varepsilon_n)(kX+lY))=(\alpha_1,\dots,\alpha_n)(kX+lY)\\
& =k(\alpha_1,\dots,\alpha_n)X+l(\alpha_1,\dots,\alpha_n)Y=kf(\alpha)+f(\beta).
\end{align*}
这个f已满足f(\varepsilon_i)=\alpha_i,而f的唯一性由(i)推出.
对命题prop432,给定m\times n矩阵A,令(\alpha_1,\dots,\alpha_n)=(\eta_1,\dots,\eta_n)A,则存在唯一的f\in\hom(U,V)使f(\varepsilon_i)\equiv\alpha_i,即(f(\varepsilon_1),\dots,f(\varepsilon_n))=(\eta_1,\dots,\eta_m)A,于是\sigma(f)=A.
\[f[(\varepsilon_1,\dots,\varepsilon_n)X]=[f(\varepsilon_1),f(\varepsilon_2),\dots,f(\varepsilon_n)]X=[f(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_n)]X.\]
其中X\in K^n.
一般地,设\alpha_1=(\varepsilon_1,\dots,\varepsilon_n)X_1,\dots,\alpha_s=(\varepsilon_1,\dots,\varepsilon_n)X_s,则有f(\alpha_i)=[f(\varepsilon_1,\dots,\varepsilon_n)]X_i.\以X_1,\dots,X_s为列向量排成n\times s矩阵X,则有
\begin{align*}
f[(\varepsilon_1,\dots,\varepsilon_n)X]{} & =f(\alpha_1,\alpha_2,\dots,\alpha_n)=(f(\alpha_1),f(\alpha_2),\dots,f(\alpha_n))=[f(\varepsilon_1),\dots,f(\varepsilon_n)]X \\
& =[f(\varepsilon_1,\dots,\varepsilon_n)]X.
\end{align*}
\[\sigma(kf+lg)=k\sigma(f)+l\sigma(g).\]
因此\sigma是\hom(U,V)到M_{m,n}K的同构映射.于是
\[\dim\hom(U,V)=\dim M_{m,n}(K)=mn.\]
设\sigma(f)=A,\sigma(g)=B,可证kf+lg在所取基下矩阵为kA+lB=k\sigma(f)+l\sigma(g),定理theorem436即证.
\begin{align*}
& ((kf+lg)\varepsilon_1,\dots,(kf+lg)\varepsilon_n) \\
={} & (kf(\varepsilon_1)+lg(\varepsilon_1),\dots,kf(\varepsilon_1)+lg(\varepsilon_1))\\
={} & k(f(\varepsilon_1),\dots,f(\varepsilon_n))+l(g(\varepsilon_1),\dots,g(\varepsilon_n))\\
={} & k(\eta_1,\dots,\eta_n)A+l(\eta_1,\dots,\eta_n)B\\
={} & (\eta_1,\dots,\eta_n)(kA+lB).
\end{align*}
在U,V,W内分别取一组基\varepsilon_,\dots,\varepsilon_n;\, \eta_1,\dots,\eta_m;\, \delta_1,\dots,\delta_s.又设\sigma(f)=A,\sigma(g)=B.
\begin{align*}
& (g\circ f(\varepsilon_1),\dots,g\circ f(\varepsilon_n))=g(f(\varepsilon_1),\dots,f(\varepsilon_n)) \\
={} & g[(\eta_1,\dots,\eta_m)A]=[g(\eta_1,\dots,\eta_m)]A=[g(\eta_1),\dots,g(\eta_m)]A\\
={} & [(\delta_1,\dots,\delta_s)B]A=(\delta_1,\dots,\delta_s)(BA).
\end{align*}
最后给出如下定理,将从更高的观点看到:相抵实际上就是同一个线性映射在不同基下的矩阵之间的关系,这就把相抵概念的实质完全弄清楚:
B\in M_{m,n}(K)是另外取定基下的矩阵的充分必要条件是B与A相抵,即r(B)=r(A).
证:先证必要性.设f(\varepsilon^\prime _1,\dots,\varepsilon^\prime _n)=(\eta^\prime _1,\dots,\eta^\prime _m)B.并令(\varepsilon^\prime _1,\dots,\varepsilon^\prime _n)=(\varepsilon_1,\dots,\varepsilon_n)Q,\, (\eta^\prime _1,\dots,\eta^\prime _m)=(\eta_1,\dots,\eta_m)P,其中Q,P分别为n,m阶可逆方阵.代入得
\begin{gather*}
\begin{split}
f(\varepsilon^\prime _1,\dots,\varepsilon^\prime _n) & =f[(\varepsilon_1,\dots,\varepsilon_n)Q] =[f(\varepsilon_1,\dots,\varepsilon_n)]Q =(\eta_1,\dots,\eta_n)(AQ).\
(\eta^\prime _1,\dots,\eta^\prime _m)B & =[(\eta_1,\dots,\eta_m)P]B =(\eta_1,\dots,\eta_m)(PB).
\end{split} \
AQ=PB\Longleftrightarrow B=P^{-1}AQ\Longleftrightarrow B,A\, \text{相抵}.
\end{gather*}
下证充分性.若B与A相抵,存在m,n阶可逆方阵R,Q使B=RAQ,令P=R^{-1},在U,V内各作基变换(\varepsilon^\prime _ 1,\dots,\varepsilon^\prime _ n)=(\varepsilon _ 1,\dots,\varepsilon _ n)Q,\, (\eta^\prime _ 1,\dots,\eta^\prime _ m)=(\eta _ 1,\dots,\eta _ m)P.不难看出f在新取定的基下矩阵为P^{-1}AQ=RAQ=B.
5.5. 线性变换的基本概念
这段开始把对线性映射的讨论限制到一种最重要的情况,即U=V的情况.
\[\textbf{E}=\textbf{A}\circ\textbf{B}=\textbf{B}\circ\textbf{A}\Longleftrightarrow E=\sigma(\textbf{A})\sigma(\textbf{B})=\sigma(\textbf{B})\sigma(\textbf{A}).\]
即\textbf{A}为可逆线性变换的充分必要条件是\sigma(\textbf{A})为可逆方阵,而且\sigma(\textbf{A}^{-1})=\sigma(\textbf{A})^{-1},其中用到了\sigma为双射这一结论.
\begin{align*}
\textbf{A}\alpha{} & =\textbf{A}[(\varepsilon _ 1,\dots,\varepsilon _ n)X]=[\textbf{A}(\varepsilon _ 1,\dots,\varepsilon _ n)]X \\
& =[(\varepsilon _ 1,\dots,\varepsilon _ n)A]X\\
& =(\varepsilon _ 1,\dots,\varepsilon _ n)(AX).
\end{align*}
5.6. 线性变换在不同基下的矩阵
\[B=T^{-1}AT.\]
\begin{align*}
\boldsymbol{A}(\eta _ 1,\dots,\eta _ n) & =(\eta _ 1,\dots,\eta _ n)B \\
\boldsymbol{A}[(\varepsilon _ 1,\varepsilon _ 2,\dots,\varepsilon _ n)T] & =[(\varepsilon _ 1,\varepsilon _ 2,\dots,\varepsilon _ n)T]B\\
[\boldsymbol{A}(\varepsilon _ 1,\varepsilon _ 2,\dots,\varepsilon _ n)]T & =(\varepsilon _ 1,\varepsilon _ 2,\dots,\varepsilon _ n)(TB)\\
(\varepsilon _ 1,\varepsilon _ 2,\dots,\varepsilon _ n)(AT) & =(\varepsilon _ 1,\varepsilon _ 2,\dots,\varepsilon _ n)(TB).
\end{align*}
由\varepsilon _ 1,\dots,\varepsilon _ n线性无关即T可逆,
\[AT=TB\Longleftrightarrow B=T^{-1}AT.\]
若B\sim A,则存在可逆矩阵T使B=T^{-1}AT,现在可以找到一个线性变换,它在一组基\varepsilon _ 1,\dots,\varepsilon _ n下的矩阵为A.令(\eta _ 1,\dots,\eta _ n)=(\varepsilon _ 1,\dots,\varepsilon _ n)T,则由theorem413,(\eta _ 1,\dots,\eta _ n)是一组基,原线性变换在此新基下的矩阵为T^{-1}AT=B.
6. 线性变换的特征值与特征向量
对数域K上n维线性空间V内的一个线性变换\boldsymbol{A},希望找到一组基\eta _ 1,\dots,\eta _ n使\boldsymbol{A}在这组基下的矩阵具有最简单的形式.对于矩阵运算来说,对角形最为简单.自然要问能不能找到一组基使\boldsymbol{A}在这组基下的矩阵具有对角形?
\[(\boldsymbol{A}\eta _ 1,\dots,\boldsymbol{A}\eta _ n)=(\eta _ 1,\dots,\eta _ n)
\begin{bmatrix}
\lambda _ 1 & & & \\
& \lambda _ 2 & & \\
& & \ddots & \\
& & & \lambda _ n
\end{bmatrix}.
\]
具体写出来就是\boldsymbol{A}\eta _ 1=\lambda _ 1\eta _ 1,\boldsymbol{A}\eta _ 2=\lambda _ 2\eta _ 2,\dots,\boldsymbol{A}\eta _ n=\lambda _ n\eta _ n.这并不总能办到,但有一个重要启示:研究满足条件\boldsymbol{A}\xi=\lambda\xi的属于数域K的数\lambda和非零的向量\xi.
6.1. 特征值与特征向量的定义
V _ {\lambda}=\left\{\alpha\in V\mid\boldsymbol{A}\alpha=\lambda\alpha\right\}是V的子空间.
- \lambda\in K是特征值的充分必要条件是V _ {\lambda}\neq\{0\};
- 要找出属于特征值\lambda的全部特征向量,只要决定出特征子空间V,特别地,当V _ {\lambda}是有限维子空间时,只要找出它的一组基,就等于找出V _ {\lambda}的所有向量.
需要解决两个问题:1.决定K内所有使V _ {\lambda}\neq\{0\}的数\lambda;2.当V _ {\lambda}\neq\{0\}时找出它的一组基.
\boldsymbol{A}\alpha=(\varepsilon _ 1,\dots,\varepsilon _ n)(AX),\, \lambda\alpha=(\varepsilon _ 1,\dots,\varepsilon _ n)(\lambda X).于是V内的定义式等价于K^n的关系式AX=\lambda X,而\alpha\neq0\Leftrightarrow X\neq0.于是V _ {\lambda}\neq\{0\}等价于有非零\alpha\in V使\boldsymbol{A}\alpha=\lambda\alpha,等价于有非零X\in K^n使AX=\lambda X,即(\lambda E-A)X=0有非零解,其充分必要条件是|\lambda E-A|=0.第一个问题解决.
要找出V _ {\lambda}\neq\{0\}的一组基.已知\alpha\in V _ {\lambda}等价于其坐标X满足(\lambda E-A)X=0.在V内取定一组基后,V中向量对应于其坐标X,这是V到K^n的一个同构映射f.\; f(V _ {\lambda})正好是(\lambda E-A)X=0的解空间.只要找出一个基础解系,也就是找出解空间的一组基,这组基在f^{-1}的作用下得到的就是V _ {\lambda}\neq\{0\}的一组基.至此,两个问题都得到完满解答.
6.2. 特征多项式的基本性质
\begin{gather*}
\lambda+\lambda _ 2+\dots+\lambda _ n=\mathrm{tr}(A), \
\lambda _ 1\lambda _ 2\cdots\lambda _ n=|A|.
\end{gather*}
\[\lambda^m|\lambda E _ n-AB|=\lambda^n|\lambda E _ m-AB|.\]
从而得出m=n时,AB与BA的特征多项式相同.
设f(\lambda)=a _ 0\lambda^m+a _ 1\lambda^{m-1}+\dots+a _ m,显然a _ m=f(0)=\left|-A\right|=(-1)^n|A|,故只需证m=n,\, a _ 0=1,\, a _ 1=-\mathrm{tr}(A).
归纳证之.当n=1时,f(\lambda)=\lambda-a _ {11},显然成立.下面设n-1阶方阵成立,一方面,
\[f^\prime (\lambda)=a _ 0m\lambda^{m-1}+a _ 1(m-1)\lambda^{m-2}+\dots+a _ {m-1},\]
另一方面由定理theorem324,
\[f^\prime (\lambda)=\frac{\mathrm{d}}{\mathrm{d}\lambda}\left|\lambda E-A\right|=\sum _ {i=1}^{n}\left|(\lambda E-A) _ i\right|,\]
其中(\lambda E-A) _ i表示对第i行求导,把(\lambda E-A) _ i对第i行(该行除了第i列为1其余为0)展开,利用归纳假设,有
\begin{align*}
\left|(\lambda E-A) _ i\right| & =\begin{vmatrix}
\lambda-a _ {11} & \cdots & -a _ {1i} & \cdots & -a _ {1n} \\
\vdots & & & & \vdots \\
0 & \cdots & 1 & \cdots & 0 \\
\vdots & & & & \vdots \\
-a _ {n1} & \cdots & -a _ {ni} & \cdots & \lambda-a _ {nn}
\end{vmatrix} \\
& =\left|\lambda E _ {n-1}-A( _ i^i)\right|=\lambda^{n-1}-\mathrm{tr}(A( _ i^i))\lambda^{n-2}+\cdots\\
& =\lambda^{n-1}-(\mathrm{tr}(A)-a _ {ii})\lambda^{n-2}+\cdots
\end{align*}
代回原式,
\begin{align*}
f^\prime (\lambda) & =\sum _ {i=1}^{n}(\lambda^{n-1}-(\mathrm{tr}(A)-a _ {ii})\lambda^{n-2}+\cdots) \\
& =n\lambda^{n-1}-(n-1)\mathrm{tr}(A)\lambda^{n-2}+\cdots\\
& =a _ 0m\lambda^{m-1}+a _ 1(m-1)\lambda^{m-2}+\dots+\cdots.
\end{align*}
借助分块矩阵的技巧,可以得到定理theorem443的证明.
\begin{align*}
\begin{vmatrix}
E _ m & 0 \\
-A & E _ n
\end{vmatrix}\begin{vmatrix}
\lambda E _ m & B \\
\lambda A & \lambda E _ n
\end{vmatrix} & =\begin{vmatrix}
\lambda E _ m & B \\
0 & \lambda E _ n-AB
\end{vmatrix}=\lambda^m\left|\lambda E _ n-AB\right| \\
\begin{vmatrix}
\lambda E _ m & B \\
\lambda A & \lambda E _ n
\end{vmatrix}\begin{vmatrix}
E _ m & 0 \\
-A & E _ n
\end{vmatrix} & =\begin{vmatrix}
\lambda E _ m-BA & B \\
0 & \lambda E _ n
\end{vmatrix}=\lambda^n\left|\lambda E _ m-BA\right|.
\end{align*}
6.3. 具有对角形矩阵的线性变换
\[V=V _ {\lambda _ 1}\oplus V _ {\lambda _ 2}\oplus\dots\oplus V _ {\lambda _ k}=\bigoplus _ {i=1}^k V _ {\lambda _ i}.\]
在\boldsymbol{A}可对角化的情况下,每个V _ {\lambda _ i}中任取一组基,合并后得到V的一组基,在这组基下\boldsymbol{A}的矩阵为对角矩阵.
如果\boldsymbol{A}的矩阵可对角化,在某组基下的矩阵成对角形,这组基即是\boldsymbol{A}的n个线性无关的特征向量.而若\boldsymbol{A}有n个线性无关的特征向量,它们组成V的一组基,显然\boldsymbol{A}在这组基下的矩阵成对角形.
设特征向量\xi _ 1,\dots,\xi _ k分别属于不同的特征值\lambda _ 1,\dots,\lambda _ k,对k作归纳.当k=1时,由\xi _ 1\neq0,当然线性无关,可知成立.设在k-1个不同的特征值时已经成立,可证k个不同特征值的情况也成立.考察l _ 1\lambda _ 1+\dots+l _ k\lambda _ k=0,两边作线性变换得l _ 1\boldsymbol{A}\lambda _ 1+\dots+l _ k\boldsymbol{A}\lambda _ k=0,即l _ 1\lambda _ 1\xi _ 1+\dots+l _ k\lambda _ k\xi _ k=0.而
\lambda _ 1(l _ 1\lambda _ 1+\dots+l _ k\lambda _ k)=0\Rightarrow l _ 2(\lambda _ 1-\lambda _ 2)\xi _ 2+\dots+l _ k(\lambda _ 1-\lambda _ k)\xi _ k=0\Rightarrow l _ 2(\lambda _ 1-\lambda _ 2)=\dots=l _ k(\lambda _ 1-\lambda _ k)=0\Rightarrow l _ 2=\dots=l _ k=0\Rightarrow l _ 1=0.从而\xi _ 1,\dots,\xi _ k线性无关.
设0=\sum\alpha _ i\, (\alpha _ i\in V _ {\lambda _ i}),可证其表法为一.若某个\alpha _ i不为0,则它是属于特征值\lambda _ i的特征向量,上式表明一些属于不同特征值的特征向量线性相关,与上面的命题矛盾,从而\sum V _ {\lambda _ i}是直和.
对于定理theorem445,设M=\bigoplus V _ {\lambda _ i}\subseteq V.如果M=V,在每个V _ {\lambda _ i}中任取一组基,合并后得到V的一组基,这组基里的向量是\boldsymbol{A}的n个线性无关的特征向量,故\boldsymbol{A}在这组基下的矩阵成对角矩阵;如果\boldsymbol{A}的在某组基下的矩阵可对角化,那么这组基的每个向量都是特征向量,必属于某特征子空间V _ {\lambda _ i}\subseteq M,那么任一\alpha\in V都属于M,于是V=M.
M=V的充分必要条件是\dim V _ {\lambda _ 1}+\dots+\dim V _ {\lambda _ k}=\dim V,所以定理条件是否满足可通过计算特征值和特征子空间的一组基立刻得到解决.
\[(\lambda _ 1\boldsymbol{E}-\boldsymbol{A})\circ(\lambda _ 2\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ k\boldsymbol{E}-\boldsymbol{A})=\boldsymbol{0}.\]
定理theorem446证明:必要性:若\boldsymbol{A}的矩阵可对角化,由定理theorem445,V=V _ {\lambda _ 1}\oplus V _ {\lambda _ 2}\oplus\dots\oplus V _ {\lambda _ k}.此时,对任意\alpha\in V _ {\lambda _ i},有(\lambda _ i\boldsymbol{E}-\boldsymbol{A})\alpha=\boldsymbol{0}.注意到
\[(\lambda _ s\boldsymbol{E}-\boldsymbol{A})\circ(\lambda _ t\boldsymbol{E}-\boldsymbol{A})\alpha=(\lambda _ t\boldsymbol{E}-\boldsymbol{A})\circ(\lambda _ s\boldsymbol{E}-\boldsymbol{A})\alpha \]
有
\begin{align*}
&(\lambda _ 1\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ i\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ k\boldsymbol{E}-\boldsymbol{A})\alpha \\ ={}&(\lambda _ 1\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ {i-1}\boldsymbol{E}-\boldsymbol{A})\circ(\lambda _ {i+1}\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ k\boldsymbol{E}-\boldsymbol{A})\circ(\lambda _ {i}\boldsymbol{E}-\boldsymbol{A})\alpha \\
={}&0.
\end{align*}
现在对任意\alpha\in V,\, \alpha=\sum \alpha _ i,于是
\begin{align*}
& (\lambda _ 1\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ i\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ k\boldsymbol{E}-\boldsymbol{A})\sum\alpha _ i \\
={} & \sum(\lambda _ 1\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ i\boldsymbol{E}-\boldsymbol{A})\circ\dots\circ(\lambda _ k\boldsymbol{E}-\boldsymbol{A})\alpha _ i\\
={} & 0.
\end{align*}
充分性:设\boldsymbol{A}在某组基下的矩阵为A,那么(\lambda _ 1E-A)(\lambda _ 2E-A)\cdots(\lambda _ kE-A)=0.不难看出有
\[r(\lambda _ 1E-A)+r(\lambda _ 2E-A)+\dots+r(\lambda _ kE-A)\leqslant(k-1)n.\]
注意到\dim V _ {\lambda _ i}为(\lambda _ iE-A)X=0的解空间的维数,于是
\[n\leqslant \sum (n-r(\lambda _ iE-A))\Longleftrightarrow\dim V\leqslant\sum\dim V _ {\lambda _ i}\Longleftrightarrow \dim V=\dim \sum V _ {\lambda _ i}.\]
由前面的推理知\sum V _ {\lambda _ i}是直和,故V=V _ {\lambda _ 1}\oplus V _ {\lambda _ 2}\oplus\dots\oplus V _ {\lambda _ k}.
定理theorem447证明:必要性:矩阵可对角化,则有V=\bigoplus V _ {\lambda _ i}.现令M _ i=M\cap V _ {\lambda _ i},由定理theorem449,M=\bigoplus M _ i.设M _ i对V _ {\lambda _ i}的补空间为N _ i.由N _ i\subseteq V _ {\lambda _ i}知\sum N _ i为直和,令N=\bigoplus N _ i,下证它是\boldsymbol{A}的不变子空间且是M对V的补空间.对任意子空间N _ i中向量\alpha,有\boldsymbol{A}\alpha=\lambda _ i\alpha\in N _ i,故N _ i是不变子空间,从而N是不变子空间.现又有M+N=\sum M _ i+\sum N _ i=\sum(M _ i+N _ i)=\sum V _ {\lambda _ i}=V,来证M+N是直和.设0=\alpha+\beta\; (\alpha\in M,\beta\in N),有0=\sum \alpha _ i+\sum \beta _ i=\sum(\alpha _ i+\beta _ i),而\alpha _ i+\beta _ i\in V _ {\lambda _ i}\Rightarrow \alpha _ i+\beta _ i=0,又M _ i\oplus N _ i=V _ {\lambda _ i},故\alpha _ i=\beta _ i=0\Rightarrow\alpha=\beta=0\Rightarrow V=M\oplus N.
充分性:先给出如下引理:
V是复数域上的,故必有一特征根\lambda _ 1,设\alpha _ 1是其特征向量,则:M=L(\alpha _ 1)为\boldsymbol{A}的一维不变子空间,由\boldsymbol{A}是完全可约的,存在n-1维的不变子空间N使V=M\oplus N,可以证明\boldsymbol{A}| _ N也是完全可约的.再对V的维数n归纳:n=1时矩阵当然是对角矩阵,假定结论对n-1成立,则对\dim V=n,上面已有V=L(\alpha _ 1)\oplus N,\; \boldsymbol{A}| _ N完全可约,由归纳假设N中存在一组基使\boldsymbol{A}| _ N的矩阵成对角形,就有\boldsymbol{A}\alpha _ i=\lambda _ i\alpha _ i\; (i\geqslant 2),这样在V的基\alpha _ 1,\alpha _ 2,\dots,\alpha _ n下\boldsymbol{A}的矩阵成对角形.
下面证\boldsymbol{A}| _ N完全可约,即对任一\boldsymbol{A}| _ N的不变子空间S,存在\boldsymbol{A}| _ N的不变子空间T使N=S\oplus T.由\boldsymbol{A}完全可约,S\subseteq N\subseteq A,存在\boldsymbol{A}的不变子空间R使V=S\oplus R.由引理,N=S\oplus(N\cap R),而T=(N\cap R)是\boldsymbol{A}| _ N的不变子空间,故欲证成立.
6.4. 不变子空间
若\boldsymbol{A}在基\varepsilon _ 1,\dots,\varepsilon _ n下的矩阵成准对角形
\[A=\begin{bmatrix}
\begin{matrix}
A _ 1 & \\
& A _ 2
\end{matrix} & 0 \\
0 & \begin{matrix}
\ddots & \\
& A _ s
\end{matrix}
\end{bmatrix},\]
把这组基按A _ i的阶n _ i分为s段:\varepsilon _ {11},\varepsilon _ {12},\dots,\varepsilon _ {1n _ 1},\dots,\varepsilon _ {s1},\varepsilon _ {s2},\dots,\varepsilon _ {sn _ s}.这时有(\boldsymbol{A}\varepsilon _ {i1},\dots,\boldsymbol{A}\varepsilon _ {in _ i})=(\varepsilon _ {i1},\dots,\varepsilon _ {in _ i})A _ i.则M _ i=L(\varepsilon _ {i1},\dots,\varepsilon _ {in _ i})是\boldsymbol{A}的不变子空间,且\sum M _ i=V.而\dim\sum M _ i=n=\sum n _ i=\sum\dim M _ i,故V=M _ 1\oplus M _ 2\oplus\dots\oplus M _ s.
设V=M _ 1\oplus M _ 2\oplus\dots\oplus M _ s,在每个不变子空间M _ i内取一组基,合并成V的一组基,则\boldsymbol{A}在这组基下的矩阵成准对角形.
定理theorem449看似显然,实则不是很简单.范德蒙德行列式在这其中又发挥了其神奇作用.设V=V _ {\lambda _ 1}\oplus V _ {\lambda _ 2}\oplus\dots\oplus V _ {\lambda _ k},对一不变子空间M,令N _ i=M\cap V _ {\lambda _ i},可以证明M=N _ {\lambda _ 1}\oplus N _ {\lambda _ 2}\oplus\dots\oplus N _ {\lambda _ k}.
设0=\sum\alpha _ i,\, \alpha _ i\in N _ i\subseteq V _ {\lambda _ i},而\sum V _ {\lambda _ i}为直和,故\alpha _ i\equiv0,所以\sum N _ i为直和.
显然\sum N _ i\subseteq M,只要证任意\alpha\in M,\, \alpha可表为\sum\alpha _ i\, (\alpha _ i\in N _ i)即可.
\begin{align*}
\alpha & =\alpha _ 1+\alpha _ 2+\dots+\alpha _ k\; (\alpha _ i\in V _ {\lambda _ i}) \\
\boldsymbol{A}\alpha & =\lambda _ 1\alpha _ 1+\lambda _ 2\alpha _ 2+\dots+\lambda _ k\alpha _ k\\
& \cdots\\
\boldsymbol{A}^{k-1}\alpha & =\lambda^{k-1} _ 1\alpha _ 1+\lambda^{k-1} _ 2\alpha _ 2+\dots+\lambda^{k-1} _ k\alpha _ k,
\end{align*}
即
\[\begin{bmatrix}
\alpha \\
\boldsymbol{A}\alpha \\
\vdots \\
\boldsymbol{A}^{n-1}\alpha
\end{bmatrix}=
\begin{bmatrix}
1 & 1 & \cdots & 1 \\
\lambda _ 1 & \lambda _ 2 & \cdots & \lambda _ k \\
\vdots & \vdots & & \vdots \\
\lambda^{k-1} _ 1 & \lambda^{k-1} _ 2 & \cdots & \lambda^{k-1} _ k
\end{bmatrix}
\begin{bmatrix}
\alpha _ 1 \\
\alpha _ 2 \\
\vdots \\
\alpha _ k
\end{bmatrix}.\]
上式中的方阵可逆,是逆矩阵为T,则
\[\begin{bmatrix}
\alpha _ 1 \\
\alpha _ 2 \\
\vdots \\
\alpha _ k
\end{bmatrix}=T\begin{bmatrix}
\alpha \\
\boldsymbol{A}\alpha \\
\vdots \\
\boldsymbol{A}^{k-1}\alpha
\end{bmatrix}.\]
M是不变子空间,故\alpha,\boldsymbol{A}\alpha,\dots,\boldsymbol{A}^{k-1}\alpha\in M,由上式得出\alpha _ i\in M,\, \alpha _ i\in V _ {\lambda _ i}\cap M=N _ i.
现在已得到M=N _ {\lambda _ 1}\oplus N _ {\lambda _ 2}\oplus\dots\oplus N _ {\lambda _ k},在每个N _ i中取一组基,因N _ i\in V _ {\lambda _ i},这组基的向量全是特征向量,它们合并成M的一组基,在此组基下\boldsymbol{A}| _ M的矩阵即为对角形.
\begin{align*}
& \boldsymbol{A}^k\alpha=a _ 0\alpha+a _ 1\boldsymbol{A}\alpha+\dots+a _ {k-1}\boldsymbol{A}^{k-1}\alpha \\
\Longrightarrow{} & f(\lambda)=\lambda^k-a _ {k-1}\lambda^{k-1}-\dots-a _ 1\lambda-a _ 0.
\end{align*}
证:考察向量组\alpha,\boldsymbol{A}\alpha,\dots,\boldsymbol{A}^n\alpha,有n+1个向量,必线性相关,故必存在最小正整数k使\boldsymbol{A}^k\alpha=a _ 0\alpha+a _ 1\boldsymbol{A}\alpha+\dots+a _ {k-1}\boldsymbol{A}^{k-1}\alpha,同时\alpha,\boldsymbol{A}\alpha,\dots,\boldsymbol{A}^{k-1}\alpha线性无关(否则同理会得到更小的k,与已得的最小性矛盾).显然M是不变子空间,\boldsymbol{A}| _ M在基\alpha,\boldsymbol{A}\alpha,\dots,\boldsymbol{A}^{k-1}\alpha下的矩阵及特征多项式为
\[J=\begin{bmatrix}
0 & 0 & 0 & \cdots & \cdots & a _ 0 \\
1 & 0 & 0 & \cdots & \cdots & a _ 1 \\
0 & 1 & 0 & \cdots & \cdots & a _ 2 \\
\vdots & \vdots & \ddots & \ddots & & \vdots \\
0 & 0 & 0 & \ddots & 0 & a _ {k-2} \\
0 & 0 & 0 & \cdots & 1 & a _ {k-1}
\end{bmatrix},f(\lambda)=
\begin{vmatrix}
\lambda & 0 & 0 & \cdots & \cdots & -a _ 0 \\
-1 & \lambda & 0 & \cdots & \cdots & -a _ 1 \\
0 & -1 & \lambda & \cdots & \cdots & -a _ 2 \\
\vdots & \vdots & \ddots & \ddots & & \vdots \\
0 & 0 & 0 & \ddots & \lambda & -a _ {k-2} \\
0 & 0 & 0 & \cdots & -1 & \lambda-a _ {k-1}
\end{vmatrix}.\]
f(\lambda)=D _ k按第一行展开得
\begin{align*}
D _ k & =\lambda D _ {k-1}-a _ 0=\lambda(\lambda D _ {k-2}-a _ 1)-a _ 0=\lambda^2 D _ {k-2}-a _ 1\lambda-a _ 0 \\
& =\lambda^2(\lambda D _ {k-3}-a _ 2)-a _ 1\lambda-a _ 0=\lambda^3 D _ {k-3}-a _ 2\lambda^2-a _ 1\lambda-a _ 0\\
& =\dots=\lambda^{k-1}D _ 1-a _ {k-2}\lambda^{k-2}-\dots-a _ 1\lambda-a _ 0\\
& =\lambda^{k-1}(\lambda-a _ {k-1})-a _ {k-2}\lambda^{k-2}-\dots-a _ 1\lambda-a _ 0\\
& =\lambda^k-a _ {k-1}\lambda^{k-1}-\dots-a _ 1\lambda-a _ 0.
\end{align*}
6.5. 商空间中的诱导变换
上一段利用空间分解研究线性变换,本段利用商空间研究线性变换.
商空间中的诱导变换是指\boldsymbol{A}\overline{\alpha}=\overline{\boldsymbol{A}\alpha}.这样的定义是根据如下事实:对线性变换\boldsymbol{A}若\alpha\equiv\beta\Rightarrow \boldsymbol{A}\alpha\equiv\boldsymbol{A}\beta.这是因为,设\alpha=\beta+m\Rightarrow \boldsymbol{A}\alpha=\boldsymbol{A}\beta+\boldsymbol{A}m=\boldsymbol{A}\beta+m^\prime.这就保证了当\overline{\alpha}=\overline{\beta}时必有\overline{\boldsymbol{A}\alpha}=\overline{\boldsymbol{A}\beta},从而定义在逻辑上无矛盾.进一步可证明它是线性变换.
\boldsymbol{A}\overline{\alpha}=\overline{\boldsymbol{A}\alpha}可以写成\boldsymbol{A}\varphi(\alpha)=\varphi(\boldsymbol{A}\alpha).
\boldsymbol{A}(k\overline{\alpha}+l\overline{\beta})=\boldsymbol{A}(\overline{k\alpha+l\beta})=\overline{\boldsymbol{A}(k\alpha+l\beta)}=\overline{k\boldsymbol{A}\alpha+l\boldsymbol{A}\beta}=k\overline{\boldsymbol{A}\alpha}+l\overline{\boldsymbol{A}\beta}=k\boldsymbol{A}\overline{\alpha}+l\boldsymbol{A}\overline{\beta}.
诱导变换的引入有利于在商空间的角度研究线性变换,因为线性变换能够作用于一个剩余类.
对定理theorem4410,在不变子空间M内取一组基\varepsilon _ 1,\dots,\varepsilon _ r,扩充成V的一组基\varepsilon _ 1,\dots,\varepsilon _ n,前面已指出\boldsymbol{A}在这组基下的矩阵为
\[A=\begin{bmatrix}
A _ {11} & A _ {12} \\
0 & A _ {22}
\end{bmatrix}.\]
则
\[f(\lambda)=|\lambda E-A|=
\begin{vmatrix}
\lambda E-A _ {11} & -A _ {12} \\
0 & \lambda E-A _ {22}
\end{vmatrix}=|\lambda E-A _ {11}||\lambda E-A _ {22}|.\]
前面也指出\overline{\varepsilon} _ {r+1},\dots,\overline{\varepsilon} _ n为V/M的一组基.可以推导:诱导变换\boldsymbol{A}在V/M的这组基下,
\[(\boldsymbol{A}\overline{\varepsilon} _ {r+1},\dots,\boldsymbol{A}\overline{\varepsilon} _ n)=(\overline{\varepsilon} _ {r+1},\dots,\overline{\varepsilon} _ n)A _ {22}.\]
故h(\lambda)=|\lambda E-A _ {22}|.联系g(\lambda)=|\lambda E-A _ {11}|即证.
下面先给出定理theorem4411的两个证明.
证明一:线性空间中\alpha为非零向量,利用定理theorem44100,存在不变子空间M=L(\alpha,\boldsymbol{A}\alpha,\dots,\boldsymbol{A}^{k-1}\alpha),使\boldsymbol{A}的特征多项式为g(\lambda)=\lambda^k-a _ {k-1}\lambda^{k-1}-\dots-a _ 1\lambda-a _ 0,且有\boldsymbol{A} ^k\alpha=a _ 0\alpha+a _ 1\boldsymbol{A}\alpha+\dots+a _ {k-1}\boldsymbol{A}^{k-1}\alpha,于是(利用定理theorem4410)
\[g(A)=A^k-a _ {k-1}A^{k-1}-\dots-a _ 1A-a _ 0E=0\Longrightarrow f(A)=g(A)h(A)=0.\]
证明二:记\lambda E-A的伴随矩阵为T,得(\lambda E-A)T=|\lambda E-A|E=f(\lambda)E,将T按各个元中\lambda的次数分拆为n个矩阵之和,并将各个矩阵中的\lambda提出,T=\lambda^{n-1}T _ {n-1}+\lambda^{n-2}T _ {n-2}+\dots+\lambda T _ 1+T _ 0,
\begin{gather*}
f(\lambda)E=(\lambda^n+c _ {n-1}\lambda^{n-1}+\dots+c _ 1\lambda+c _ 0)E=\lambda^n E+c _ {n-1}\lambda^{n-1}E+\dots+c _ 1\lambda E+c _ 0 E \
\begin{split}
(\lambda E-A)T & =(\lambda E-A)\sum _ {i=0}^{n-1}\lambda^i T _ i=\sum _ {i=0}^{n-1}\lambda^{i+1}T _ i-\sum _ {i=0}^{n-1}\lambda^i AT _ i=\sum _ {i=1}^{n}\lambda^{i}T _ {i-1}-\sum _ {i=0}^{n-1}\lambda^i AT _ i \
& =\lambda^n T _ {n-1}+\sum _ {i=1}^{n-1}\lambda^{i}(T _ {i-1}-AT _ i)-AT _ 0
\end{split}
\end{gather*}
矩阵的n^2个元都是关于\lambda的多项式,由多项式恒等定理,每个元中\lambda各项系数相等,每个次数的n^2个方程又反过来得到了一个矩阵方程,且和直接对比对应项系数得到的方程一致,就有:
\begin{gather*}
T _ {n-1}=E,\; T _ {i-1}-AT _ i=c _ i E\, (1\leqslant i\leqslant n-1),\; -AT _ 0=c _ 0 E \
f(A)=A^n+c _ {n-1}A^{n-1}+\dots+c _ 1 A+c _ 0=A^n+\sum _ {i=1}^{n-1}(T _ {i-1}-AT _ i)A^{i}-AT _ 0=0.
\end{gather*}
对命题prop443,对线性空间的维数n做数学归纳法.一维显然成立,设对n-1维成立,当\dim V=n时,\boldsymbol{A}必有一特征值\lambda,设\boldsymbol{A}\varepsilon _ 0=\lambda\varepsilon _ 0,\; \varepsilon _ 0非零,则M=L(\varepsilon _ 0)为一维不变子空间,V/M为n-1维线性空间,根据定理theorem4410,可知\boldsymbol{A}在V/M内特征多项式的根都属于K,由归纳假设,在V/M内存在一组基\overline{\varepsilon} _ 1,\dots,\overline{\varepsilon} _ {n-1},使\boldsymbol{A}在这组基下的矩阵成上三角形,写出来就是\boldsymbol{A}\overline{\varepsilon} _ i=a _ {1i}\overline{\varepsilon} _ 1+\dots+a _ {ii}\overline{\varepsilon} _ i\, (i=1,2,\dots,n-1).可以证\varepsilon _ 0,\varepsilon _ 1,\dots,\varepsilon _ {n-1}是V的一组基,只需它们线性无关.
设\sum k _ i\varepsilon _ i=0.利用自然映射以及\varphi(\varepsilon _ 0)=\overline{0},\, \varphi(\sum k _ i\varepsilon)=\sum k _ i\varphi(\varepsilon _ i)=k _ 1\overline{\varepsilon} _ 1+\dots+k _ {n-1}\overline{\varepsilon} _ {n-1}=\overline{0}.而\overline{\varepsilon} _ 1,\dots,\overline{\varepsilon} _ {n-1}是商空间的一组基,故k _ 1=\dots=k _ {n-1}=0.代回原式,因\varepsilon _ 0非零知k _ 0=0.
上面已有\boldsymbol{A}\overline{\varepsilon} _ i=a _ {1i}\overline{\varepsilon} _ 1+\dots+a _ {ii}\overline{\varepsilon} _ i\, (i=1,2,\dots,n-1),有\overline{\boldsymbol{A}\varepsilon _ i}=\overline{a _ {1i}\varepsilon _ 1+\dots+a _ {ii}\varepsilon _ i}.这说明\boldsymbol{A}\varepsilon _ i=k _ i\varepsilon _ 0+ a _ {1i}\varepsilon _ 1+\dots+a _ {ii}\varepsilon _ i,于是\boldsymbol{A}在基\varepsilon _ 0,\varepsilon _ 1,\dots,\varepsilon _ {n-1}下的矩阵为
\[A=\begin{bmatrix}
\lambda & k _ 1 & k _ 2 & \cdots & k _ {n-1} \\
0 & a _ {11} & a _ {12} & \cdots & a _ {1,n-1} \\
0 & 0 & a _ {22} & \cdots & a _ {2,n-1} \\
\vdots & \vdots & \vdots & & \vdots \\
0 & 0 & 0 & \cdots & a _ {n-1,n-1}
\end{bmatrix}.\]
发表回复