带度量的线性空间

我的原文地址

第六章:带度量的线性空间 非零向量两两正交,则它们线性无
1. 总括 本章的内容,是利用上一章关于对称双线性函数和二次型的理论,在实数域和复数域上的线性空间中引进度量,使线性空间的理论得以发展提高.与之相应地,是深入讨论这类线性空间中与度量性质密切联系的一些特殊类型的线性变换,从而使线性变换理论也得以前进一步.

本章所讨论的线性空间与一般线性空间的区别是它带有内积,随之而来的是所讨论的课题具有新的特点.

  1. 从基的选取上看,根据内积的性质可选取特殊的基,使其度量矩阵具有最简单的形状,在欧氏空间和酉空间就是标准正交基,在辛空间就是辛基.在这样的基下内积具有最简单的表达形式,可以使所讨论的问题大大简化.因而,在度量的线性空间中选取基时,一般都选取这类基.由于基的选取具有特殊性,随之就产生如下新课题:
    • 两组基间的过渡矩阵具有新的性质,在欧氏空间为正交矩阵,在酉空间为酉矩阵,在辛空间为辛矩阵;
    • 这种新基的实际选法,在欧式空间和酉空间都有施密特正交化方法.
  2. 线性代数的一个基本方法是把空间V分解为两个子空间的直和,但这个分解一般不唯一.而在欧氏空间与酉空间中,可以选取正交补空间,使V=M\oplus M^{\perp},这个分解是唯一的,这就为讨论问题提供了极大的方便.
  3. 在线性空间中引入度量后,线性变换理论便产生了新的课题,即研究与度量(内积)相关联的特殊线性变换.这主要是如下两大类:
    • 不改变空间度量(内积)的线性变换\boldsymbol{A}
      \[(\boldsymbol{A}\alpha,\boldsymbol{A}\beta)=(\alpha,\beta).\]
      在欧氏空间称为正交变换,在酉空间称为酉变换,在四维时空空间称为广义洛仑兹变换,在辛空间称为辛变换.对欧氏空间我们证明正交变换的矩阵可经正交矩阵化为最简单的准对角形,而对酉空间,其矩阵可经酉矩阵化为对角形.这一结果比第四章前进了一步.
    • 对称变换或厄米特变换,其特点是
      \[(\boldsymbol{A}\alpha,\beta)=(\alpha,\boldsymbol{A}\beta).\]
      对这类变换,我们证明总存在一组标准正交基,使其矩阵成实对角矩阵.

在本章应学会使用内积来处理线性代数的各种课题,它可以使许多问题的探讨更深入,方法也更多样,从而使思路更开阔.


Contents
Contents
 1.  总括
 2.  欧几里得空间的定义和基本性质
   2.1.  欧几里得空间的定义
   2.2.  有限维欧氏空间
     2.2.1.  标准正交基的存在性
     2.2.2.  两组标准正交基间的过渡矩阵
     2.2.3.  标准正交基的求法
     2.2.4.  在标准正交基下内积的公式
   2.3.  正交补
   2.4.  欧氏空间同构
 3.  欧几里得空间中的特殊线性变换
   3.1.  正交变换
   3.2.  对称变换
   3.3.  用正交矩阵化实对称矩阵为对角形
 4.  酉空间
   4.1.  酉空间的基本概念
     4.1.1.  酉空间的标准正交基及其求法
     4.1.2.  标准正交基间的过渡矩阵
   4.2.  酉变换
   4.3.  正规变换与厄米特变换
     4.3.1.  共轭变换
     4.3.2.  正规变换
     4.3.3.  厄米特变换
 5.  (四维时空空间、辛空间)
     5.0.1.  四维时空空间的度量
     5.0.2.  辛空间

2. 欧几里得空间的定义和基本性质 2.1. 欧几里得空间的定义

Definition 1. 设实数域\mathbb{R}线性空间V,其内任两向量\alpha,\beta都按某一法则对应于\mathbb{R}内一个唯一确定的数(\alpha,\beta).称(\alpha,\beta)为向量\alpha,\beta的内积,如果
  1. 对任意k _ 1,k _ 2\in \mathbb{R},\, \alpha _ 1,\alpha _ 2,\beta\in V,有
    \[(k _ 1\alpha _ 1+k _ 2\alpha _ 2,\beta)=k _ 1(\alpha _ 1,\beta)+k _ 2(\alpha _ 2,\beta);\]
  2. 对任意\alpha _ 1,\alpha _ 2\in V,有
    \[(\alpha,\beta)=(\beta,\alpha);\]
  3. 对任意\alpha\in V,有
    \[(\alpha,\alpha)\geqslant0,\]且
    \[(\alpha,\alpha)=0\Longleftrightarrow\alpha=0.\]
定义了这种内积的实数域上的线性空间称为欧几里得空间.

把1和2结合起来可以看出(\alpha,\beta)实际上是V内一个对称双线性函数.如果V有限维,那么3表明(\alpha,\alpha)是一个正定二次型函数,即(\alpha,\beta)在任一组基下的矩阵都是正定矩阵.反过来,在V内给定对称双线性函数f(\alpha,\beta)(\alpha,\alpha)是一个正定二次型函数,则只要把内积定义为(\alpha,\alpha)=f(\alpha,\alpha),那么V关于这个内积成一欧氏空间.由此可知:实数域上有限维线性空间的内积概念和正定二次型概念之间有密切的联系.

Theorem 2 (柯西-布尼雅可夫斯基不等式). 对欧氏空间V内任意两向量\alpha,\beta,有
\[|(\alpha,\beta)|\leqslant|\alpha|\cdot|\beta|,\]
等号成立的充要条件为:\alpha,\beta线性相关.

\alpha=0时显然,否则0\leqslant(t\alpha+\beta,t\alpha+\beta)=(\alpha,\alpha)t^2+2(\alpha,\beta)t+(\beta,\beta),由判别式小于等于0即知,而等号成立恰为t\alpha+\beta=0.

\mathbb{R}^n上同一线性空间,定义的内积不同,认为得到了不同的欧氏空间.
2.2. 有限维欧氏空间 把关于上一章关于双线性函数所得的一般结论应用于内积这一特殊双线性函数,得到

  • 内积(\alpha,\beta)在任一组基\varepsilon _ 1,\dots,\varepsilon _ n下的度量矩阵(\, (\varepsilon _ i,\varepsilon _ j)\, )都是正定矩阵;
  • 如果(\alpha,\beta)在另一组基\eta _ 1,\dots,\eta _ n下的度量矩阵为\overline{G}=(\, (\eta _ i,\eta _ j)\, ),而(\eta _ 1,\dots,\eta _ n)=(\varepsilon _ 1,\dots,\varepsilon _ n)T,则\overline{G}=T^{\mathrm{T}}GT,即内积在不同基下的度量矩阵互相合同;
  • 内积可用度量矩阵表达为(\alpha,\beta)=X^{\mathrm{T}}GY,其中X,Y分别是\alpha,\beta的坐标.
Proposition 3. 欧氏空间内的s个非零向量两两正交,则它们线性无关.

2.2.1. 标准正交基的存在性

n维欧氏空间任取一组基\xi _ 1,\dots,\xi _ n,这组基下的度量矩阵G合用于E:存在可逆T使T^{\mathrm{T}}GT=E.令(\varepsilon _ 1,\dots,\varepsilon _ n)=(\xi _ 1,\dots,\xi _ n)T,则(\alpha,\beta)在基\varepsilon _ 1,\dots,\varepsilon _ n下的度量矩阵为E,从而\varepsilon _ 1,\dots,\varepsilon _ nV的一组标准正交基.故任一有限维欧氏空间都存在标准正交基.
2.2.2. 两组标准正交基间的过渡矩阵

Theorem 4. 实数域上n阶方阵T是正交矩阵的充要条件是以下之一成立:
  • T^{\mathrm{T}}=T^{-1}\Longleftrightarrow T^{\mathrm{T}}T=E\Longleftrightarrow TT^{\mathrm{T}}=E
  • Tn维欧氏空间两组标准正交基间的过渡矩阵;
  • T的行(列)向量组是欧氏空间\mathbb{R}^n的一组标准正交基.

内积在两组标准正交基下度量矩阵都是E,而且它们合同:T^{\mathrm{T}}ET=E,故T正交.反过来若T是正交矩阵,则T可逆,于是设标准正交基\varepsilon _ 1,\dots,\varepsilon _ n,\, (\eta _ 1,\dots,\eta _ n)=(\varepsilon _ 1,\dots,\varepsilon _ n)T,内积在\eta _ 1,\dots,\eta _ n下的过渡矩阵与E合同,故为T^{\mathrm{T}}ET=T^{\mathrm{T}}T=E,故\eta _ 1,\dots,\eta _ n也是一组标准正交基.

T的行向量组为\alpha _ 1,\dots,\alpha _ n,将TT^{\mathrm{T}}=Eij列元素写出来即得(\alpha _ i,\alpha _ j)=\delta _ {ij},于是该行向量组是标准正交基,反之完全一样.
2.2.3. 标准正交基的求法 施密特(Schmidt)正交化方法:给定V中一个线性无关向量组(I): \alpha _ 1,\dots,\alpha _ s,作出一个新向量组(II): \varepsilon _ 1,\dots,\varepsilon _ s,满足:L(\alpha _ 1,\dots,\alpha _ s)=L(\varepsilon _ 1,\dots,\varepsilon _ s);\; \varepsilon _ 1,\dots,\varepsilon _ s两两正交.

可用如下方法给出:
\begin{align*}
\varepsilon _ 1 & =\alpha _ 1, \\
\varepsilon _ 2 & =\alpha _ 2-\frac{(\alpha _ 2,\varepsilon _ 1)}{(\varepsilon _ 1,\varepsilon _ 1)}\varepsilon _ 1, \\
\varepsilon _ 3 & =\alpha _ 3-\frac{(\alpha _ 3,\varepsilon _ 1)}{(\varepsilon _ 1,\varepsilon _ 1)}\varepsilon _ 1
-\frac{(\alpha _ 3,\varepsilon _ 2)}{(\varepsilon _ 2,\varepsilon _ 2)}\varepsilon _ 2, \\
& \cdots \\
\varepsilon _ s & =\alpha _ s-\frac{(\alpha _ s,\varepsilon _ 1)}{(\varepsilon _ 1,\varepsilon _ 1)}\varepsilon _ 1
-\dots-\frac{(\alpha _ s,\varepsilon _ {s-1})}{(\varepsilon _ {s-1},\varepsilon _ {s-1})}\varepsilon _ {s-1}.
\end{align*}

显然向量组(I)的前i个向量可被(II)的前i个线性表示,从上往下逐行带入可知反过来也可,于是两向量组线性等价,即L(\alpha _ 1,\dots,\alpha _ i)=L(\varepsilon _ 1,\dots,\varepsilon _ i),由此知\varepsilon _ 1,\dots,\varepsilon _ i线性无关,因而其中不会有零向量,有(\varepsilon _ i,\varepsilon _ i)\neq0,这表明上面每一步都是有意义的;验证可知\varepsilon _ 1,\dots,\varepsilon _ s确实两两正交.

V中任取一组基,利用施密特正交化方法得到与之等价的所含向量两两正交的一组基,再将其单位化,即得V的一组标准正交基.
2.2.4. 在标准正交基下内积的公式 取定标准正交基\varepsilon _ 1,\dots,\varepsilon _ n,令\alpha=(\varepsilon _ 1,\dots,\varepsilon _ n)X,\, \beta=(\varepsilon _ 1,\dots,\varepsilon _ n)Y,则有
\[(\alpha,\beta)=\sum _ {i,j}(\varepsilon _ i,\varepsilon _ j)x _ i y _ j=\sum _ {i,j}\delta _ {ij}x _ i y _ j=x _ 1y _ 1+x _ 2y _ 2+\dots+x _ n y _ n.\]
恰好等于对应坐标相乘的求和. 内积在一般的基下表示为(\alpha,\beta)=X^{\mathrm{T}}GY,但在标准正交基下G变成了E:\, (\alpha,\beta)=X^{\mathrm{T}}Y. 前者的基相当于解析几何中的仿射坐标系,后者相当于直角坐标系;两相比较,标准正交基简单多了,这就是在欧氏空间处理问题都选用标准正交基的缘故. 初学往往容易忽视这个重要进展而出现各种错误.
2.3. 正交补

Theorem 5.Mn维欧氏空间V的一个子空间,则V=M\oplus M^{\perp}.

Corollary 6. n维欧氏空间V中任一两两正交单位向量组都可扩充为一组标准正交基.

\alpha=M\cap M^{\perp},由正交补定义(\alpha,\alpha)=0\Rightarrow \alpha=0\Rightarrow M\cap M^{\perp}={0}\Rightarrow M+M^{\perp}是直和. 取M的一组标准正交基\varepsilon _ 1,\dots,\varepsilon _ r并将其扩充为V的一组基\varepsilon _ 1,\dots,\varepsilon _ r,\alpha _ {r+1},\dots,\alpha _ n,再用施密特正交化方法将其正交化并单位化,得出V的一组标准正交基.\, 因\varepsilon _ 1,\dots,\varepsilon _ r已经两两正交,故保持不动,所以所得标准正交基为\varepsilon _ 1,\dots,\varepsilon _ r,\varepsilon _ {r+1},\dots,\varepsilon _ n.\, 现在\varepsilon _ {r+1},\dots,\varepsilon _ nM的基正交,故都属于M^{\perp},于是
\[V=L(\varepsilon _ 1,\dots,\varepsilon _ r)+L(\varepsilon _ {r+1},\dots,\varepsilon _ n)\subseteq M+M^{\perp}\subseteq V\Longrightarrow V=M+ M^{\perp}\Longrightarrow V=M\oplus M^{\perp}.\]

在一般线性空间内,一个子空间,但并不唯一,实际上有无穷多选择方法,这使处理问题存在不少麻烦.\, 在欧氏空间内,一个子空间有正交补空间,而正交补空间是唯一的,这就方便了运用子空间分解来处理问题.
2.4. 欧氏空间同构

Definition 7. 设两欧氏空间V _ 1,V _ 2,称映射\sigma为欧氏空间V _ 1到欧氏空间V _ 2的同构映射,如果:
  • \sigmaV _ 1V _ 2的线性空间同构映射,亦即\sigmaV _ 1V _ 2的保持线性关系的双射;
  • \sigma保持内积关系:(\sigma(\alpha),\sigma(\beta))=(\alpha,\beta).
此时称V _ 1V _ 2同构.

同构的欧氏空间具有相同的代数性质和度量性质.\, 如果其中一个有限维,那么另一个也一定是有限维的,且有相同的维数.\, 若\varepsilon _ 1,\dots,\varepsilon _ sV _ 1中两两正交单位向量组,则可以验证\sigma(\varepsilon _ 1),\dots,\sigma(\varepsilon _ s)V _ 2中两两正交单位向量组;反之也有一样的结论.\, 因此,在\sigma下,V _ 1V _ 2中的标准正交基是一一对应的.

现在设两n维欧氏空间V _ 1,V _ 2且各取一组标准正交基\varepsilon _ 1,\dots,\varepsilon _ n\varepsilon' _ 1,\dots,\varepsilon' _ n.\, 定义V _ 1V _ 2的映射为:若\alpha=(\varepsilon _ 1,\dots,\varepsilon _ n)X,则令\sigma(\alpha)=(\varepsilon' _ 1,\dots,\varepsilon' _ n)X.\, 容易验证,\sigmaV _ 1V _ 2的欧氏空间同构映射,因此对于有限维欧氏空间来说,只要维数相同就彼此同构.

可以建立V\mathbb{R}^n的欧氏空间同构:设\alpha=(\varepsilon _ 1,\dots,\varepsilon _ n)X,定义\sigma(\alpha)=X,可以证明\sigmaV\mathbb{R}^n的线性空间同构.\, 按V中内积在标准正交基下的计算公式及\mathbb{R}^n中内积的定义,有(\alpha,\beta)=(\sigma(\alpha),\sigma(\beta)),故\sigmaV\mathbb{R}^n的欧氏空间同构.
3. 欧几里得空间中的特殊线性变换 这一节是欧氏空间中与度量密切相关的线性变换,即正交变换与对称变换.
3.1. 正交变换

Definition 8.n维欧式空间V内一线性变换\boldsymbol{A}为正交变换,如果(\boldsymbol{A}\alpha,\boldsymbol{A}\beta)\equiv(\alpha,\beta).

V内任意线性变换\boldsymbol{A},定义f(\alpha,\beta)=(\boldsymbol{A}\alpha,\boldsymbol{A}\beta),由线性变换的性质和内积的性质知f(\alpha,\beta)V内对称双线性函数.

V内取定一组基\varepsilon _ 1,\dots,\varepsilon _ n,设\boldsymbol{A}在这组基下矩阵为A,又设\alpha=(\varepsilon _ 1,\dots,\varepsilon _ n)X,\beta=(\varepsilon _ 1,\dots,\varepsilon _ n)Y,则有
\[
(\boldsymbol{A}\varepsilon _ 1,\dots,\boldsymbol{A}\varepsilon _ n)=(\varepsilon _ 1,\dots,\varepsilon _ n)A, \quad
\boldsymbol{A}\alpha=(\varepsilon _ 1,\dots,\varepsilon _ n)AX, \quad
\boldsymbol{A}\beta=(\varepsilon _ 1,\dots,\varepsilon _ n)AY,
\]
设所取基的度量矩阵为G,则
\[(\alpha,\beta)=X^{\mathrm{T}}GY,\quad f(\alpha,\beta)=(AX)^{\mathrm{T}}G(AY)=X^{\mathrm{T}}(A^{\mathrm{T}}GA)Y.\]

于是\boldsymbol{A}是正交变换等价于上两式相等,等价于A^{\mathrm{T}}GA=G.\, 从而有如下定理:

Theorem 9.n维线性空间V内一线性变换\boldsymbol{A},下面命题等价:
  • \boldsymbol{A}是正交变换;
  • \boldsymbol{A}在标准正交基下的矩阵为正交矩阵;
  • \boldsymbol{A}把标准正交基映为标准正交基;
  • 对任意\alpha\in V,\, |\boldsymbol{A}\alpha|=|\alpha|.

取基为标准正交基,度量矩阵变为E\boldsymbol{A}是正交变换等价于A^{\mathrm{T}}A=E,即A是正交矩阵.

接上,由(\boldsymbol{A}\varepsilon _ 1,\dots,\boldsymbol{A}\varepsilon _ n)=(\varepsilon _ 1,\dots,\varepsilon _ n)A,知
\boldsymbol{A}是正交变换等价于\boldsymbol{A}\varepsilon _ 1,\dots,\boldsymbol{A}\varepsilon _ n是标准正交基.

由命题5.1.3,有|\boldsymbol{A}\alpha|\equiv|\alpha|
\Leftrightarrow(\boldsymbol{A}\alpha,\boldsymbol{A}\alpha)\equiv(\alpha,\alpha)
\Leftrightarrow Q _ f(\alpha)\equiv (\alpha,\alpha)
\Leftrightarrow f(\alpha,\beta)\equiv(\alpha,\beta)\Leftrightarrow\boldsymbol{A}
为正交变换.\, 至此已证四点等价性,都可作为正交变换的定义.

Theorem 10. a
  • 恒等变换是正交变换;
  • 正交变换的乘积(复合)仍是正交变换;
  • 正交变换的逆存在,且仍是正交变换.

只看第三点,由命题4.3.4,以及正交变换在任一组基下的矩阵是正交矩阵(可逆),知正交变换(设为\boldsymbol{A})可逆,且(\alpha,\beta)=(\boldsymbol{E}\alpha,\boldsymbol{E}\beta)=(\boldsymbol{A}(\boldsymbol{A}^{-1}\alpha),\boldsymbol{A}(\boldsymbol{A}^{-1}\beta))
=(\boldsymbol{A}^{-1}\alpha,\boldsymbol{A}^{-1}\beta)
,即\boldsymbol{A}^{-1}是正交变换.

a

设正交矩阵A,由定义|A|^2=1,\, |A|=\pm1.\, 正交变换\boldsymbol{A}在不同基下的矩阵相似,有相同的行列式,故\boldsymbol{A}在任一组基下的矩阵的行列式都是\pm1.\, 如果A=1,则称\boldsymbol{A}为第一类正交变换或V内一个旋转;如果是-1,则称为第二类正交变换.

下面是正交变换的特征值、对正交变换讨论如何找出一组基使其矩阵尽可能简化.

Theorem 11.\lambda _ 0是一个n阶正交矩阵A的在复数域上的特征值,则|\lambda _ 0|=1.

Corollary 12. 正交变换的特征值只能是\pm1.

Corollary 13. 奇数维欧氏空间内的第一类正交变换\boldsymbol{A}必有一特征值1,从而存在非零向量\varepsilon使\boldsymbol{A}\varepsilon=\varepsilon.

Theorem 14.f(\lambda)=|\lambda E-A|有一复根\lambda _ 0=\mathrm{e}^{\mathrm{i}\varphi}=\cos\varphi+\mathrm{i}\sin\varphi(\varphi\neq k\pi),则存在互相正交的单位向量\eta _ 1,\eta _ 2,使
\[
\begin{cases}
\boldsymbol{A}\eta _ 1=\cos\varphi\cdot\eta _ 1-\sin\varphi\cdot\eta _ 2,\\
\boldsymbol{A}\eta _ 2=\sin\varphi\cdot\eta _ 1+\cos\varphi\cdot\eta _ 2.
\end{cases}
\]
于是M=L(\eta _ 1,\eta _ 2)V的二维不变子空间,\boldsymbol{A}| _ MM标准正交基\eta _ 1,\eta _ 2下的矩阵为二阶正交矩阵
\[\begin{bmatrix}
\cos\varphi & \sin\varphi \\
-\sin\varphi & \cos\varphi
\end{bmatrix}.\]

Theorem 15. 如果M是正交变换\boldsymbol{A}的不变子空间,则M^{\perp}也是\boldsymbol{A}的不变子空间.

Theorem 16 (正交变换的基本结果).\boldsymbol{A}n维欧氏空间V内的正交变换,则在V内存在一组标准正交基,使\boldsymbol{A}在这组基下的矩阵成如下对角形:
\[
J=\begin{bmatrix}
\lambda _ 1 & & & & & & \\
& \lambda _ 2 & & & & & \\
& & \ddots & & & & \\
& & & \lambda _ k & & & \\
& & & & S _ 1 & & \\
& & & & & \ddots & \\
& & & & & & S _ l
\end{bmatrix},
\]
其中
\begin{align*}
\lambda _ i & =\pm1, \\
S _ j & =\begin{bmatrix}
\cos\varphi _ j & -\sin\varphi _ j \\
\sin\varphi _ j & \cos\varphi _ j
\end{bmatrix}(\varphi _ j\neq k'\pi).
\end{align*}

已经知道三维几何空间是实数域上的3维线性空间,向量点乘是其内积,关于此内积它成为3维欧氏空间,根据推论tuilun622,三维几何空间的旋转\boldsymbol{A}必有一特征值1,根据定理theorem626,在三维几何空间中存在一组标准正交基,使\boldsymbol{A}在这组基下的矩阵为下列三种矩阵之一(注意它们的行列式为1):
\[
E=\begin{bmatrix}
1 & & \\
& 1 & \\
& & 1
\end{bmatrix},
F=\begin{bmatrix}
1 & & \\
& -1 & \\
& & -1
\end{bmatrix},
J=\begin{bmatrix}
1 & & \\
& \cos\varphi & -\sin\varphi \\
& \sin\varphi & \cos\varphi
\end{bmatrix}.
\]
于是三维几何空间的旋转\boldsymbol{A},或为恒等变换,或为绕某一转动轴(设所取基为\eta _ 1,\eta _ 2,\eta _ 3,则它为\eta _ 1所确定的直线)沿逆时针方向旋转\pi角或\varphi(\neq k\pi)角.

对正交变换的任一不变子空间,其正交补空间也是不变子空间,这就为利用空间分解研究问题提供了依据.\, 第四章中,由定义4.5,上面的定理说明正交变换是完全可约的;还证明了定理4.4.7,说明复数域上完全可约与矩阵可对角化等价.\, 欧氏空间是实数域上线性空间,所以正交变换矩阵一般不可对角化,但利用上面空间分解技巧可以证明它的矩阵能准对角化,而且主对角线上是一阶方阵或简单的二阶方阵.

a

证明:对定理11,已知A可逆,则\lambda _ 0\neq0\; (\, |0E-A|=|-A|\neq0).\, 齐次线性方程组(\lambda _ 0E-A)X=0\mathbb{C}^n内有非零解向量X _ 0,非零就是说\smash{\overline{X}}^{\mathrm{T}} _ 0X _ 0=\sum |x _ i|^2\neq0.\, 已有AX _ 0=\lambda _ 0X _ 0,取共轭并转置得到\smash{\overline{X}}^{\mathrm{T}} _ 0A^{\mathrm{T}}=\overline{\lambda} _ 0\smash{\overline{X}}^{\mathrm{T}} _ 0\Longrightarrow
\smash{\overline{X}}^{\mathrm{T}} _ 0A^{\mathrm{T}}(AX _ 0)=\overline{\lambda} _ 0\smash{\overline{X}}^{\mathrm{T}} _ 0(\lambda _ 0X _ 0)\Longrightarrow
\smash{\overline{X}}^{\mathrm{T}} _ 0X _ 0=(\overline{\lambda} _ 0\lambda _ 0)\smash{\overline{X}}^{\mathrm{T}} _ 0X _ 0\Longrightarrow
\overline{\lambda} _ 0\lambda _ 0=|\lambda _ 0|^2=1
.

正交变换特征值只能实数,故就是\pm1;奇数维欧氏空间内的第一类正交变换\boldsymbol{A}的特征多项式复根满足\overline{\lambda} _ 0\lambda _ 0=1,而这个特征多项式是实系数多项式,其虚根成对存在(而每对乘积为1),而其所有复根乘积为|A|=1,故得出所有实根乘积为1,又特征多项式为奇数次,故奇数个实根,所以其中必有一个1.

对定理theorem624,设\mathbb{C}上齐次线性方程组(\lambda _ 0E-A)X=0有一非零解X=U+\mathrm{i}W\, (U,W\in\mathbb{R}^n).\, 首先\lambda _ 0非实数说明U\neq0,否则W\neq0,\, AW=\lambda _ 0W,这与\lambda _ 0非实数矛盾.\, 因为X乘非零实数k仍是解,故可取适当的X使U\mathbb{R}^n的单位向量,即U^{\mathrm{T}}U=1.


\[\eta _ 1=(\varepsilon _ 1,\dots,\varepsilon _ n)U,\, \eta _ 2=(\varepsilon _ 1,\dots,\varepsilon _ n)W.\]
可以证明这两向量满足定理要求.

(1)由A(U+\mathrm{i}W)=(\cos\varphi+\mathrm{i}\sin\varphi)(U+\mathrm{i}W),比较实部虚部得
\[
\begin{cases}
AU=\cos\varphi\cdot U-\sin\varphi\cdot W,\\
AW=\sin\varphi\cdot U+\cos\varphi\cdot W.
\end{cases}
\]
于是
\begin{align*}
\boldsymbol{A}\eta _ 1 & =(\varepsilon _ 1,\dots,\varepsilon _ n)AU
=(\varepsilon _ 1,\dots,\varepsilon _ n)(\cos\varphi\cdot U-\sin\varphi\cdot W) \\
& =\cos\varphi\cdot\eta _ 1-\sin\varphi\cdot\eta _ 2,\\
\boldsymbol{A}\eta _ 2 & =(\varepsilon _ 1,\dots,\varepsilon _ n)AW
=(\varepsilon _ 1,\dots,\varepsilon _ n)(\sin\varphi\cdot U+\cos\varphi\cdot W) \\
& =\sin\varphi\cdot\eta _ 1+\cos\varphi\cdot\eta _ 2,
\end{align*}

(2)剩下只需证\eta _ 1,\eta _ 2是互相正交的单位向量,这只要证明(U,U)=(W,W)=1,\, (U,W)=0.\, 重新写回AX=\lambda _ 0X,取转置得X^{\mathrm{T}}A^ {\mathrm{T}}=\lambda _ 0 X^ {\mathrm{T}},从而X^{\mathrm{T}}A^ {\mathrm{T}}(AX)=\lambda _ 0 X^ {\mathrm{T}}(\lambda _ 0X),即X^{\mathrm{T}}X=\lambda _ 0^2\, X^{\mathrm{T}}X,由\lambda _ 0非实数可推知X^{\mathrm{T}}X=0.\, 这时具体写出来,就是
\[(U^{\mathrm{T}}+\mathrm{i}W^{\mathrm{T}})(U+\mathrm{i}W)=(U^{\mathrm{T}}U-W^{\mathrm{T}}W)+\mathrm{i}(U^{\mathrm{T}}W+W^{\mathrm{T}}U)=0,\]
所以
\[U^{\mathrm{T}}U-W^{\mathrm{T}}W=0, \quad U^{\mathrm{T}}W+W^{\mathrm{T}}U=0\]
已经有U^{\mathrm{T}}U=1,从而得到W^{\mathrm{T}}W=U^{\mathrm{T}}U=1;注意到U^{\mathrm{T}}W=(U,W)=(W,U)=W^{\mathrm{T}}U,故还得到(U,W)=0.

对定理theorem625,因为V=M\oplus M^{\perp},在M,M^{\perp}分别取一组标准正交基\varepsilon _ 1,\dots,\varepsilon _ r;\varepsilon _ {r+1},\dots,\varepsilon _ n,合并后成为V中两两正交的向量,即为一组标准正交基,故\boldsymbol{A}\varepsilon _ 1,\dots,\boldsymbol{A}\varepsilon _ n也是一组标准正交基.\, 现在\boldsymbol{A}\varepsilon _ {r+j}\boldsymbol{A}\varepsilon _ 1,\dots,\boldsymbol{A}\varepsilon _ r均正交,故\boldsymbol{A}\varepsilon _ {r+j}\in M^{\perp}.\, 对任一\alpha\in M^{\perp},\, \alpha=k _ {r+1}\varepsilon _ {r+1}+\dots+k _ n \varepsilon _ n,故\boldsymbol{A}\alpha=k _ {r+1}\boldsymbol{A}\varepsilon _ {r+1}+\dots+k _ n\boldsymbol{A}\varepsilon _ n\in M^{\perp}.\, 故M^{\perp}\boldsymbol{A}的不变子空间.

现在可以证明定理theorem626\, 了,考虑对n作数学归纳法.

n=1,此时\boldsymbol{A}在任一组基(取单位向量,即为标准正交基)下的矩阵为一阶实方阵A=(a _ {11}),而a _ {11}=|A|=\pm1,故命题成立.

n=2,若\boldsymbol{A}有一特征值\lambda _ 1,则\lambda _ 1=\pm1.\, 取\lambda _ 1对应的单位特征向量\varepsilon _ 1,令M=L(\varepsilon _ 1),则M^{\perp}是一维子空间,且是不变子空间,在M^{\perp}内任取一单位向量\varepsilon _ 2,则\boldsymbol{A}\varepsilon _ 2=\lambda _ 2\varepsilon _ 2,\, \lambda _ 2=\pm1.\, 现在\varepsilon _ 1,\varepsilon _ 2是一组标准正交基,在此基下\boldsymbol{A}的矩阵为J=\mathrm{diag}(\lambda _ 1,\lambda _ 2).

若无特征值,由定理theorem624,可知此时命题成立.

下面设对维数小于n的欧氏空间内的正交变换命题成立,对维数为n的,分两种情况:

(1)若\boldsymbol{A}有一特征值\lambda _ 1=\pm1,取与\lambda _ 1对应的单位特征向量\varepsilon _ 1,令M=L(\varepsilon _ 1),则M^{\perp}n-1维不变子空间,\boldsymbol{A}| _ {M^{\perp}}M^{\perp}内正交变换,按归纳假设,在M^{\perp}内存在一组标准正交基\varepsilon _ 2,\dots,\varepsilon _ n,使\boldsymbol{A}在此基下的矩阵J _ 1具有定理所要求的准对角形.\, 现在\varepsilon _ 1,\dots,\varepsilon _ nV的标准正交基,在此基下\boldsymbol{A}的矩阵为
\[J=\begin{bmatrix}
\lambda _ 1 & \\
& J _ 1
\end{bmatrix}\]
已符合定理要求.

(2)若\boldsymbol{A}无特征值,设特征多项式一复根\mathrm{e}^{\mathrm{i}\varphi}(\varphi\neq k\pi),由定理theorem624,存在V内两两正交单位向量\eta _ 1,\eta _ 2,\, M=L(\eta _ 1,\eta _ 2)\boldsymbol{A}不变子空间,\boldsymbol{A}| _ M在标准正交基\eta _ 1,\eta _ 2下矩阵为
\[S=\begin{bmatrix}
\cos\varphi & \sin\varphi \\
-\sin\varphi & \cos\varphi
\end{bmatrix}(\varphi\neq k\pi).\]
现在M^{\perp}n-2维不变子空间,\boldsymbol{A}| _ {M^{\perp}}M^{\perp}内正交变换,按归纳假设,在M^{\perp}内存在一组标准正交基\varepsilon _ 1,\varepsilon _ {n-2},使\boldsymbol{A}| _ {M^{\perp}}在此组基下的矩阵J _ 1满足定理要求.\, 现在\varepsilon _ 1,\varepsilon _ {n-2},\eta _ 1,\eta _ 2V内一组标准正交基,\boldsymbol{A}在此组基下矩阵为
\[J=\begin{bmatrix}
J _ 1 & \\
& S
\end{bmatrix}\]
已符合定理要求.
3.2. 对称变换 下面是n维欧氏空间内另一类重要的线性变换.

Definition 17.n维线性空间V内一线性变换\boldsymbol{A}为对称变换,如果(\boldsymbol{A}\alpha,\beta)\equiv(\alpha,\boldsymbol{A}\beta).

V内任意线性变换\boldsymbol{A},定义f(\alpha,\beta)=(\boldsymbol{A}\alpha,\beta),\, g(\alpha,\beta)=(\alpha,\boldsymbol{A}\beta),又在V内取一组基\varepsilon _ 1,\dots,\varepsilon _ n,设\boldsymbol{A}在这组基下矩阵为A,又设\alpha=(\varepsilon _ 1,\dots,\varepsilon _ n)X,\, \beta=(\varepsilon _ 1,\dots,\varepsilon _ n)Y
则有
\[
(\boldsymbol{A}\varepsilon _ 1,\dots,\boldsymbol{A}\varepsilon _ n)=(\varepsilon _ 1,\dots,\varepsilon _ n)A, \quad
\boldsymbol{A}\alpha=(\varepsilon _ 1,\dots,\varepsilon _ n)AX, \quad
\boldsymbol{A}\beta=(\varepsilon _ 1,\dots,\varepsilon _ n)AY,
\]
设所取基度量矩阵为G,那么
\begin{align*}
f(\alpha,\beta) & =(\boldsymbol{A}\alpha,\beta)=(AX)^{\mathrm{T}}GY=X^{\mathrm{T}}(A^{\mathrm{T}}G)Y, \\
g(\alpha,\beta) & =(\alpha,\boldsymbol{A}\beta)=X^{\mathrm{T}}G(AY)=X^{\mathrm{T}}(GA)Y.
\end{align*}
于是\boldsymbol{A}为对称变换等价于X^{\mathrm{T}}(A^{\mathrm{T}}G)Y=X^{\mathrm{T}}(GA)Y,等价于A^{\mathrm{T}}G=GA.

Theorem 18. \boldsymbol{A}是对称变换的充要条件是\boldsymbol{A}在标准正交基下的矩阵是是对称矩阵.

这是因为标准正交基下度量矩阵为EA^{\mathrm{T}}G=GA变为A^{\mathrm{T}}=A.

该定理说明,在取定一组标准正交基后,V中全体对称变换的集合和n阶实对称矩阵的集合之间就可以建立一一对应的关系,因而在研究对称变换时可以利用实对称矩阵的性质,反之研究实对称矩阵时也可以利用对称变换的结果.

可以证明,对对称变换,一定可以找出一组标准正交基使这个变换在这组基下的矩阵成对角形,这就是对称变换的基本定理.

Theorem 19. 实对称矩阵特征值都是实数.

Corollary 20. 任一对称变换至少有一个特征值.

Theorem 21. 对称变换的对应于不同特征值的特征向量互相正交.

Theorem 22.M是对称变换\boldsymbol{A}的不变子空间,则M^{\perp}也是不变子空间.

Theorem 23.\boldsymbol{A}n维欧氏空间V内的一个对称变换,则在V内存在一组标准正交基,使\boldsymbol{A}在此组基下的矩阵成对角形.

Corollary 24. 对实对称矩阵A,存在n阶正交矩阵T,使T^{-1}AT=T^{\mathrm{T}}AT=D为对角形.

Theorem 25. 设实二次型f=\sum\sum a _ {ij}x _ ix _ j\, (a _ {ij}=a _ {ji}),则存在正交矩阵T,使在线性替换X=TZ下二次型化为标准形\lambda _ 1z _ 1^2+\lambda _ 2z _ 2^2+\dots+\lambda _ nz _ n^2,且\lambda _ 1,\dots,\lambda _ n除了可能差一个排列次序外,是被f唯一确定的.

证明:先看定理theorem628,实对称矩阵A的特征多项式f(\lambda)在复数域上任一根设为\lambda _ 0.\, 设n维非零复向量X满足:AX=\lambda _ 0X,取共轭并转置有\smash{\overline{X}}^{\mathrm{T}}A=\overline{\lambda} _ 0\smash{\overline{X}}^{\mathrm{T}},故
\smash{\overline{X}}^{\mathrm{T}}(AX)=\overline{\lambda} _ 0\smash{\overline{X}}^{\mathrm{T}}X
\lambda _ 0\smash{\overline{X}}^{\mathrm{T}}X=\overline{\lambda} _ 0\smash{\overline{X}}^{\mathrm{T}}X,而\smash{\overline{X}}^{\mathrm{T}}XX的模长,故为非零实数,从而\overline{\lambda} _ 0=\lambda _ 0,于是\lambda _ 0为实数.

定理theorem629:设\boldsymbol{A}的两不同特征值\lambda _ 1,\lambda _ 2,\, \boldsymbol{A}\xi _ 1=\lambda _ 1\xi _ 1,\boldsymbol{A}\xi _ 2=\lambda _ 2\xi _ 2,于是由(\boldsymbol{A}\xi _ 1,\xi _ 2)=(\xi _ 1,\boldsymbol{A}\xi _ 2)\lambda _ 1(\xi _ 1,\xi _ 2)=\lambda _ 2(\xi _ 1,\xi _ 2),必有(\xi _ 1,\xi _ 2)=0.

定理theorem6210:任给\alpha\in M,\beta\in M^{\perp},则(\boldsymbol{A}\alpha,\beta)=(\alpha,\boldsymbol{A}\beta)=0,从而\boldsymbol{A}\beta\in M^{\perp},故M^{\perp}也是不变子空间.

现在证明定理theorem6211,对V的维数n作数学归纳法.\, n=1时命题显然,现设命题对n-1维成立,证明对n维欧氏空间成立.

由推论tuilun623\boldsymbol{A}必有一特征值\lambda _ 1,设其对应的单位特征向量为\eta _ 1\boldsymbol{A}\eta _ 1=\lambda _ 1\eta _ 1,\, (\eta _ 1,\eta _ 1)=1.\, 现令M=L(\eta _ 1)M\boldsymbol{A}的一维不变子空间,故M^{\perp}\boldsymbol{A}n-1维不变子空间,\boldsymbol{A}限制在M^{\perp}内仍为对称变换.\, 按归纳假设,在M^{\perp}内存在一组标准正交基\eta _ 2,\dots,\eta _ n使\boldsymbol{A}\eta _ i=\lambda _ i\eta _ i\, (i=2,\dots,n).\, 易知\eta _ 1,\dots,\eta _ nV的一组标准正交基,满足\boldsymbol{A}\eta _ i=\lambda _ i\eta _ i\, (i=1,\dots,n),故\boldsymbol{A}在这组基下的矩阵成对角形.

对推论tuilun624,把A看作n维欧氏空间V内一个对称变换\boldsymbol{A}在标准正交基\varepsilon _ 1,\dots,\varepsilon _ n下的矩阵,由定理知存在标准正交基\eta _ 1,\dots,\eta _ n,使\boldsymbol{A}在这组基下的矩阵成对角形D,令T为两基间过渡矩阵:(\eta _ 1,\dots,\eta _ n)=(\varepsilon _ 1,\dots,\varepsilon _ n)T,则T为正交矩阵,T^{-1}AT=T^{\mathrm{T}}AT=D.

下证定理theorem6212,二次型f的矩阵是实对称矩阵,由上面推论,存在正交矩阵T使
T^{\mathrm{T}}AT=D=\mathrm{diag}(\lambda _ 1,\dots,\lambda _ n).\, 在正交线性变数替换X=TZ下,
\begin{align*}
f & =X^{\mathrm{T}}AX=(TZ)^{\mathrm{T}}A(TZ)=Z^{\mathrm{T}}(T^{\mathrm{T}}AT)Z \\
& =Z^{\mathrm{T}}DZ=\lambda _ 1z _ 1^2+\lambda _ 2z _ 2^2+\dots+\lambda _ nz _ n^2.
\end{align*}

a

对称变换是与内积相联系的第二种特殊线性变换.\, 按照定义,这种变换可以在内积中自由移动.\, 重要的是,这种变换实际上是实对称矩阵的线性变换形式.\, 实对称矩阵是第四章的主要研究对象,在那里是以双线性函数和二次型的形式出现,这里以线性变换的形式出现,这就使两部分知识建立密切联系.

和正交变换一样,对称变换不变子空间的正交补也是不变子空间,因而对称变换也是完全可约线性变换;与正交变换不同,对称变换的矩阵都可对角化.

需注意对称变换和对称矩阵的联系是以标准正交基为立足点的,不是在标准正交基,这个联系不存在,不应忽视这一点.
3.3. 用正交矩阵化实对称矩阵为对角形 给定实对称矩阵A,已知存在正交矩阵T使T^{-1}AT=T^{\mathrm{T}}AT=D成对角形,在许多理论和实际问题中需要把TD计算出来,下面是它们的计算方法.

A看作n维欧氏空间V内对称变换\boldsymbol{A}在标准正交基\varepsilon _ 1,\dots,\varepsilon _ n下的矩阵,设特征多项式f(\lambda)=|\lambda E-A|的全部不同根为\lambda _ 1,\dots,\lambda _ k,为全部特征值.\, \boldsymbol{A}可对角化,由定理4.4.5,
V=V _ {\lambda _ 1}\oplus\dots\oplus V _ {\lambda _ k},再根据定理theorem629V _ {\lambda _ i},V _ {\lambda _ j}\, (i\neq j)的向量互相正交,因此只要在每个V _ {\lambda _ i}中取一组标准正交基(全由特征值为\lambda _ i的特征向量组成),合并后为V内两两正交的单位向量组,即为一组标准正交基,在此基下\boldsymbol{A}的矩阵成对角形D,而T即为从\varepsilon _ 1,\dots,\varepsilon _ n到此组基的过渡矩阵,其列向量组即为此组基的n个向量在\varepsilon _ 1,\dots,\varepsilon _ n下的坐标.

第四章4.4.1已指出求每个V _ {\lambda _ i}的一组基的方法,现在V _ {\lambda _ i}是欧氏空间,只要把这组基正交化再单位化,就得到V _ {\lambda _ i}的一组标准正交基,现在需要的,只是这组标准正交基在\varepsilon _ 1,\dots,\varepsilon _ n下的坐标(T的一部分列向量).

这样TD的计算归纳为下面几个步骤:

(1)计算特征多项式f(\lambda)=|\lambda E-A|,并求出全部不同根\lambda _ 1,\dots,\lambda _ k

(2)对每个\lambda _ i,求齐次线性方程组(\lambda _ i E-A)X=0的一个基础解系X _ {i1},\dots,X _ {it _ i},即解空间M _ {\lambda _ i}的一组基;

(3)在欧氏空间\mathbb{R}^n内将X _ {i1},\dots,X _ {it _ i}正交化:
\begin{align*}
Y _ {i1} & =X _ {i1}, \\
Y _ {i2} & =X _ {i2}-\frac{(X _ {i2},Y _ {i1})}{(Y _ {i1},Y _ {i1})}Y _ {i1}, \\
Y _ {i3} & =X _ {i3}-\frac{(X _ {i3},Y _ {i1})}{(Y _ {i1},Y _ {i1})}Y _ {i1}
-\frac{(X _ {i3},Y _ {i2})}{(Y _ {i2},Y _ {i2})}Y _ {i2}, \\
& \cdots
\end{align*}
再把Y _ {i1},\dots,Y _ {it _ i}单位化,得M _ {\lambda _ i}的一组标准正交基Z _ {i1},\dots,Z _ {it _ i},此时
\eta _ {i1}=(\varepsilon _ 1,\dots,\varepsilon _ n)Z _ {i1},\dots,\eta _ {it _ i}=(\varepsilon _ 1,\dots,\varepsilon _ n)Z _ {it _ i}V _ {\lambda _ i}的一组标准正交基.\, 所寻求的正交矩阵T应为\varepsilon _ 1,\dots,\varepsilon _ n到标准正交基
\[\eta _ {11},\dots,\eta _ {1t _ 1},\eta _ {21},\dots,\eta _ {2t _ 2},\dots,\eta _ {k1},\dots,\eta _ {kt _ k}\]
的过渡矩阵,其列向量组应为
\[Z _ {11},\dots,Z _ {1t _ 1},Z _ {21},\dots,Z _ {2t _ 2},\dots,Z _ {k1},\dots,Z _ {kt _ k}.\]
而相应的对角矩阵为
\[D=\mathrm{diag}(\overbrace{\lambda _ 1,\dots,\lambda _ 1}^{t _ 1},\overbrace{\lambda _ 2,\dots,\lambda _ 2}^{t _ 2},\dots,\overbrace{\lambda _ k,\dots,\lambda _ k}^{t _ k}).\]
4. 酉空间 有了欧几里得空间后,自然提出问题:能否在复数域上的线性空间内设法定义内积,使其具有与欧氏空间相类似的性质呢?回答是肯定的.
4.1. 酉空间的基本概念

Definition 26. 设复数域\mathbb{C}上线性空间V,其内任两向量\alpha,\beta都按某一法则对应于\mathbb{R}内一个唯一确定的数(\alpha,\beta).\, 称(\alpha,\beta)为向量\alpha,\beta的内积,如果
  1. 对任意k _ 1,k _ 2\in \mathbb{C},\, \alpha _ 1,\alpha _ 2,\beta\in V,有
    \[(k _ 1\alpha _ 1+k _ 2\alpha _ 2,\beta)=k _ 1(\alpha _ 1,\beta)+k _ 2(\alpha _ 2,\beta);\]
  2. 对任意\alpha _ 1,\alpha _ 2\in V,有
    \[(\alpha,\beta)=\overline{(\beta,\alpha)};\]
    因此对任意\alpha\in V,\, (\alpha,\alpha)都是实数;
  3. 对任意\alpha\in V,有
    \[(\alpha,\alpha)\geqslant0,\]且
    \[(\alpha,\alpha)=0\Longleftrightarrow\alpha=0.\]
定义了这种内积的复数域上的线性空间称为酉空间.

从前两点可得
\begin{align*}
(\alpha,l _ 1\beta _ 1+l _ 2\beta _ 2) & =\overline{(l _ 1\beta _ 1+l _ 2\beta _ 2,\alpha)} =\overline{l _ 1(\beta _ 1,\alpha)+l _ 2(\beta _ 2,\alpha)} \\
& =\overline{l} _ 1\overline{(\beta _ 1,\alpha)}+\overline{l} _ 2\overline{(\beta _ 2,\alpha)} =\overline{l} _ 1(\alpha,\beta _ 1)+\overline{l} _ 2(\alpha,\beta _ 2).
\end{align*}
由此可看出(\alpha,\beta)对第二个变元不是线性的,所以它不是双线性函数,而是所谓“厄米特双线性函数”.\, 这是酉空间内积与欧氏空间内积的一个重要区别.\, 而这是因为第2点性质与欧氏空间的不同,而2又是保证(\alpha,\alpha)都是实数的必须条件.

类似欧氏空间,可以验证\mathbb{C}^n关于内积(\alpha,\beta)=\alpha^{\mathrm{T}}\overline{\beta}成为酉空间.\, 约定一般把\mathbb{C}^n看作酉空间时, 内积都是这样定义.
4.1.1. 酉空间的标准正交基及其求法 对应于命题prop611,有

Proposition 27. 酉空间内的s个非零向量两两正交,则它们线性无关.

标准正交基\varepsilon _ 1,\dots,\varepsilon _ n,令\alpha=(\varepsilon _ 1,\dots,\varepsilon _ n)X,\, \beta=(\varepsilon _ 1,\dots,\varepsilon _ n)Y,则有
\[(\alpha,\beta)=\sum _ {i,j}(\varepsilon _ i,\varepsilon _ j)x _ i\overline{y} _ j=\sum _ {i,j}\delta _ {ij}x _ i\overline{y} _ j
=x _ 1\overline{y} _ 1+x _ 2\overline{y} _ 2+\dots+x _ n\overline{y} _ n.\]

在酉空间内有与欧氏空间相同的施密特正交化方法.\, 给定酉空间内一个线性无关向量组\alpha _ 1,\dots,\alpha _ s,令
\begin{align*}
\varepsilon _ 1 & =\alpha _ 1, \\
\varepsilon _ 2 & =\alpha _ 2-\frac{(\alpha _ 2,\varepsilon _ 1)}{(\varepsilon _ 1,\varepsilon _ 1)}\varepsilon _ 1, \\
\varepsilon _ 3 & =\alpha _ 3-\frac{(\alpha _ 3,\varepsilon _ 1)}{(\varepsilon _ 1,\varepsilon _ 1)}\varepsilon _ 1
-\frac{(\alpha _ 3,\varepsilon _ 2)}{(\varepsilon _ 2,\varepsilon _ 2)}\varepsilon _ 2, \\
& \cdots \\
\varepsilon _ s & =\alpha _ s-\frac{(\alpha _ s,\varepsilon _ 1)}{(\varepsilon _ 1,\varepsilon _ 1)}\varepsilon _ 1
-\dots-\frac{(\alpha _ s,\varepsilon _ {s-1})}{(\varepsilon _ {s-1},\varepsilon _ {s-1})}\varepsilon _ {s-1}.
\end{align*}
那么同样有L(\alpha _ 1,\dots,\alpha _ i)=L(\varepsilon _ 1,\dots,\varepsilon _ i);\; \varepsilon _ 1,\dots,\varepsilon _ s两两正交.\, 利用施密特正交化方法把一个有限维酉空间的一组基正交化后再单位化,就得到一组标准正交基.
4.1.2. 标准正交基间的过渡矩阵

Definition 28.n阶可逆复矩阵U为酉矩阵,如果\smash{\overline{U}}^{\mathrm{T}}=U^{-1}.

Theorem 29. n阶复方阵U是酉矩阵的充要条件是U是酉空间两组标准正交基间的过渡矩阵.

Theorem 30.Mn维酉空间V的一个子空间,则V=M\oplus M^{\perp}.

\varepsilon _ 1,\dots,\varepsilon _ n是酉空间的一组标准正交基,U=(u _ {ij})是一n阶复方阵,令(\eta _ 1,\dots,\eta _ n)=(\varepsilon _ 1,\dots,\varepsilon _ n)U.\, 若\eta _ 1,\dots,\eta _ n是标准正交基,即(\eta _ i,\eta _ j)=\delta _ {ij},即u _ {1i}\overline{u} _ {1j}+\dots+u _ {ni}\overline{u} _ {nj}=\delta _ {ij},等价于\smash{\overline{U}}^{\mathrm{T}}U=E,即\smash{\overline{U}}^{\mathrm{T}}=U^{-1}.
4.2. 酉变换

Definition 31.n维酉空间V内一线性变换\boldsymbol{U}为酉变换,如果(\boldsymbol{U}\alpha,\boldsymbol{U}\beta)\equiv(\alpha,\beta).

Theorem 32.n维酉空间V内一线性变换\boldsymbol{U},下面命题等价:
  • \boldsymbol{U}是酉变换;
  • 对任意\alpha\in V,\, |\boldsymbol{U}\alpha|=|\alpha|
  • \boldsymbol{U}把标准正交基映为标准正交基;
  • \boldsymbol{U}在标准正交基下的矩阵为酉矩阵.

定理的证明与欧氏空间的已经有所不同,这是因为内积的表达式发生了变化,使得命题5.1.2不能使用(Y变成了\overline{Y}).\, 由定理theorem631知3和4是等价的,1、2、3间轮换证明:设\boldsymbol{U}把标准正交基映为标准正交基,设\alpha=(\varepsilon _ 1,\dots,\varepsilon _ n)X,\, \beta=(\varepsilon _ 1,\dots,\varepsilon _ n)Y,则\boldsymbol{U}\alpha= (\boldsymbol{U}\varepsilon _ 1,\dots,\boldsymbol{U}\varepsilon _ n)X,\,
\boldsymbol{U}\beta=(\boldsymbol{U}\varepsilon _ 1,\dots,\boldsymbol{U}\varepsilon _ n)Y
,由内积在标准正交基下的表达式,有
(\boldsymbol{U}\alpha,\boldsymbol{U}\beta)=X^{\mathrm{T}}\overline{Y}=(\alpha,\beta)
恰说明\boldsymbol{U}是酉变换.\, 1推2显然.\, 设|\boldsymbol{U}\alpha|\equiv|\alpha|,则|\boldsymbol{U}\varepsilon _ i|=|\varepsilon _ i|=1,故只需证(\boldsymbol{U}\varepsilon _ i,\boldsymbol{U}\varepsilon _ j)=0.\, 设z\in\mathbb{C}
\begin{align*}
& (\boldsymbol{U}(\varepsilon _ i+z\varepsilon _ j),\boldsymbol{U}(\varepsilon _ i+z\varepsilon _ j)) =
(\varepsilon _ i+z\varepsilon _ j,\varepsilon _ i+z\varepsilon _ j) \\
\Longrightarrow{} & \overline{z}(\boldsymbol{U}\varepsilon _ i,\boldsymbol{U}\varepsilon _ j)
+z(\boldsymbol{U}\varepsilon _ j,\boldsymbol{U}\varepsilon _ i)=
\overline{z}(\varepsilon _ i,\varepsilon _ j)+z(\varepsilon _ j,\varepsilon _ i)=0 \\
\Longrightarrow{} & \mathrm{Re}(z(\varepsilon _ j,\varepsilon _ i))=0 \\
\Longrightarrow{} & (\varepsilon _ j,\varepsilon _ i)=0.
\end{align*}
4.3. 正规变换与厄米特变换 上一段是把欧氏空间的正交变换推广到酉空间的酉变换,这段把欧氏空间的对称变换也推广到酉空间,但在这里将从更一般的角度讨论问题.

Definition 33.\boldsymbol{A},\, \boldsymbol{A}^*n维酉空间内线性变换,称\boldsymbol{A}^*\boldsymbol{A}的共轭变换,如果
(\boldsymbol{A}\alpha,\beta)\equiv(\alpha,\boldsymbol{A}^*\beta).

Definition 34.\boldsymbol{A}为正规变换,如果它与其共轭变换可交换:\boldsymbol{A}\boldsymbol{A}^*=\boldsymbol{A}^*\boldsymbol{A}.

Definition 35.\boldsymbol{A}为厄米特(Hermite)变换,如果\boldsymbol{A}^*=\boldsymbol{A}.

4.3.1. 共轭变换

如果\boldsymbol{A},\boldsymbol{A}^*在一组标准正交基下的矩阵为A,B,则(\boldsymbol{A}\alpha,\beta)=(\alpha,\boldsymbol{A}^*\beta)等价于(\boldsymbol{A}\varepsilon _ i,\varepsilon _ j)=(\varepsilon _ i,\boldsymbol{A}^*\varepsilon _ j).
\begin{gather*}
(\boldsymbol{A}\varepsilon _ i,\varepsilon _ j)=\Big(\sum a _ {ki}\varepsilon _ k,\varepsilon _ j\Big)=a _ {ji},
\quad (\varepsilon _ i,\boldsymbol{A}^*\varepsilon _ j)=\Big(\varepsilon _ i,\sum b _ {kj}\varepsilon _ k\Big)=\overline{b} _ {ij}, \\
(\boldsymbol{A}\varepsilon _ i,\varepsilon _ j)=(\varepsilon _ i,\boldsymbol{A}^*\varepsilon _ j)\Longleftrightarrow
b _ {ij}=\overline{a} _ {ji}\Longleftrightarrow B=\smash{\overline{A}}^{\mathrm{T}}
\end{gather*}

由此可知,V内任一线性变换的共轭变换存在且唯一,且它在同一组基下矩阵为A的共轭转置.\, 因此,一个酉变换\boldsymbol{U}的共轭变换即为其逆变换:\boldsymbol{U}^*=\boldsymbol{U}^{-1},于是对于酉变换,\boldsymbol{U}\boldsymbol{U}^*=\boldsymbol{U}^*\boldsymbol{U}=\boldsymbol{E}.

可以验证:
\begin{gather*}
\boldsymbol{E}^*=\boldsymbol{E},\quad (\boldsymbol{A}^*)^*=\boldsymbol{A},\quad (\boldsymbol{A}+\boldsymbol{B})^*=\boldsymbol{A}^*+\boldsymbol{B}^* \\
(\lambda\boldsymbol{A})^*=\overline{\lambda}\boldsymbol{A}^*,\quad (\boldsymbol{A}\boldsymbol{B})^*=\boldsymbol{B}^*\boldsymbol{A}^*.
\end{gather*}
4.3.2. 正规变换 根据前面,酉变换是正规变换.

Theorem 36.M是线性变换\boldsymbol{A}的不变子空间,则M^{\perp}是共轭变换\boldsymbol{A}^*的不变子空间.

Theorem 37.\xi为正规变换\boldsymbol{A}的属于特征值\lambda的特征向量,则\xi也是\boldsymbol{A}^*的属于特征值\overline{\lambda}的特征向量.

Theorem 38. 正规变换的对应于不同特征值的特征向量互相正交.

Theorem 39.\boldsymbol{A}n维酉空间V内的一个正规变换,则在V内存在一组标准正交基,使\boldsymbol{A}在此组基下的矩阵成对角形.(正规变换的基本定理)

Corollary 40.\boldsymbol{U}n维酉空间V内的一个酉变换,则在V内存在一组标准正交基,使\boldsymbol{U}在此组基下的矩阵成对角形.

定理theorem634证明与定理theorem6210如出一辙.\, 设(\boldsymbol{A}-\lambda\boldsymbol{E})\xi=0,由正规变换的可交换性质,
\begin{align*}
& ((\boldsymbol{A}^*-\overline{\lambda}\boldsymbol{E})\xi,(\boldsymbol{A}^*-\overline{\lambda}\boldsymbol{E})\xi)
=((\boldsymbol{A}-\overline{\lambda}\boldsymbol{E})^*\xi,(\boldsymbol{A}^*-\overline{\lambda}\boldsymbol{E})\xi) \\
={} & (\xi,(\boldsymbol{A}-\overline{\lambda}\boldsymbol{E})(\boldsymbol{A}^*-\overline{\lambda}\boldsymbol{E})\xi)
= (\xi,(\boldsymbol{A}^*-\overline{\lambda}\boldsymbol{E})(\boldsymbol{A}-\overline{\lambda}\boldsymbol{E})\xi)=0.
\end{align*}
这就证了定理theorem635.\, 对定理theorem636,设\boldsymbol{A}的两不同特征值\lambda,\mu\xi,\eta为分别属于它们的特征向量,那么
\[\lambda(\xi,\eta)=(\lambda\xi,\eta)=(\boldsymbol{A}\xi,\eta)=(\xi,\boldsymbol{A}^*\eta)=(\xi,\overline{\mu}\eta)=\mu(\xi,\eta)
\Longrightarrow (\xi,\eta)=0.\]

对定理theorem637,对维数n作数学归纳法.\, n=1时命题显然成立,设对n-1维成立,可证对n维酉空间也成立.\, 设\boldsymbol{A}的一特征值\lambda _ 1,它对应的单位特征向量为\eta _ 1,令M=L(\eta _ 1),由定理theorem635,同时成立着\boldsymbol{A}\eta _ 1=\lambda _ 1\eta _ 1,\boldsymbol{A}^*\eta _ 1=\overline{\lambda} _ 1\eta _ 1,故M同时为\boldsymbol{A},\boldsymbol{A}^*的不变子空间;又由定理theorem634M^{\perp}\boldsymbol{A}^*,(\boldsymbol{A}^*)^*=\boldsymbol{A}的不变子空间.\, 此时对任意\alpha,\beta\in M^{\perp}(\boldsymbol{A}\alpha,\beta)=(\alpha,\boldsymbol{A}\beta),说明限制在M^{\perp}\boldsymbol{A},\boldsymbol{A}^*仍互为共轭变换,也有\boldsymbol{A}\boldsymbol{A}^*=\boldsymbol{A}^*\boldsymbol{A},即\boldsymbol{A}限制在M^{\perp}内仍为正规变换,M^{\perp}n-1维,按归纳假设,在M^{\perp}存在标准正交基\eta _ 2,\dots,\eta _ n使\boldsymbol{A}\eta _ i=\lambda _ i\eta _ i.\, 因为(\eta _ i,\eta _ j)=\delta _ {ij},故\eta _ 1,\dots,\eta _ nV的一组标准正交基,在这组基下\boldsymbol{A}的矩阵成对角形:\boldsymbol{A}\eta _ i=\lambda _ i\eta _ i.
4.3.3. 厄米特变换 厄米特变换显然是正规变换,所以正规变换的定理对它也适用.

Definition 41.n阶复矩阵A为厄米特矩阵,如果\smash{\overline{A}}^{\mathrm{T}}=A.

Definition 42. n个复变量x _ 1,\dots,x _ n的二次齐次函数f=\sum\sum a _ {ij}\overline{x} _ ix _ j\, (a _ {ij}=\overline{a} _ {ji})称为一个厄米特二次型.

Theorem 43. 厄米特变换的特征值都是实数.

Theorem 44.\boldsymbol{A}n维酉空间V内的一个厄米特变换,则在V内存在一组标准正交基,使\boldsymbol{A}在此组基下的矩阵成实对角矩阵.

Corollary 45.An阶厄米特矩阵,则存在一个n阶酉矩阵U,使U^{-1}AU=\smash{\overline{U}}^{\mathrm{T}}AU=D是一个实对角矩阵.

Theorem 46. 对厄米特二次型,存在一个酉矩阵U,使在酉线性变数替换X=UY下它变为标准形d _ 1\overline{y} _ 1y _ 1+d _ 2\overline{y} _ 2y _ 2+\dots+d _ n\overline{y} _ ny _ n,其中d _ i\in\mathbb{R},且除排列次序外,是被f唯一确定的.

\lambda是厄米特变换\boldsymbol{A}的任一特征值,\xi为其对应的特征向量,则由定理theorem635\overline{\lambda}\xi=
\boldsymbol{A} ^*\xi=\boldsymbol{A}\xi=\lambda\xi
\xi非零,故\overline{\lambda}=\lambda\lambda\in\mathbb{R}.

定理theorem639是定理theorem637和定理theorem638的直接结果.

n维酉空间内一线性变换\boldsymbol{A}是厄米特变换的充要条件是它在一组基下的矩阵是厄米特矩阵;反之任一厄米特矩阵也可以看作一个酉空间中某个厄米特变换在一组标准正交基下的矩阵.\, 于是由定理theorem639自然得到推论tuilun632.

一个厄米特二次型的矩阵是厄米特矩阵,可以把厄米特二次型用矩阵表示为f=\smash{\overline{X}}^{\mathrm{T}}AX.

下证定理theorem6310,由上面推论,存在酉矩阵U使
\smash{\overline{U}}^{\mathrm{T}}AU=D=\mathrm{diag}(d _ 1,\dots,d _ n)为实对角矩阵.\, 在酉线性变数替换X=UY下,
\begin{align*}
f & =\smash{\overline{X}}^{\mathrm{T}}AX=(\smash{\overline{UY}})^{\mathrm{T}}A(UY)
=\smash{\overline{Y}}^{\mathrm{T}}(\smash{\overline{U}}^{\mathrm{T}}AT)Y \\
& =\smash{\overline{Y}}^{\mathrm{T}}DY=d _ 1\overline{y} _ 1y _ 1+d _ 2\overline{y} _ 2y _ 2+\dots+d _ n\overline{y} _ ny _ n.
\end{align*}
DA相似,于是d _ 1,\dots,d _ n恰为An个特征值,因而除排列次序外被f唯一确定.
5. (四维时空空间、辛空间)

本节为拓展内容

在第一节,利用实数域上的正定对称双线性函数在实数域上的线性空间内引进度量,形成欧氏空间的概念.\, 但还可以利用其它双线性函数,这样得到的在理论上和实际应用上也有重要意义.\, 本节要粗略讨论的是在物理学中很重要的一类带度量的实数域上线性空间,即狭义相对论中所使用的四维时空空间的度量,它是以不定实二次型作为度量的一类非欧几里得度量空间.

在第三节,利用复数域上一种厄米特双线性函数在复数域上的线性空间引进度量,形成酉空间的概念.\, 同样在复数域上线性空间内还可以用其它双线性函数来引进度量.\, 本节要粗略讨论的是借助满秩反对称双线性函数在复数域上线性空间内引进度量,这就是辛空间的理论,它在理论与实际应用上是同样重要的.
5.0.1. 四维时空空间的度量 先从比较一般的角度讨论问题.

Definition 47.V是实数域上n维线性空间,f(\alpha,\beta)是满秩对称双线性函数,在V内定义内积(\alpha,\beta)=f(\alpha,\beta),则称V关于这一内积为准欧几里得空间.

取定一组基\varepsilon _ 1,\dots,\varepsilon _ n,给定正整数r<n,对\alpha=\sum a _ i\varepsilon _ i,\, \beta=\sum b _ i\varepsilon _ i,定义内积
\[(\alpha,\beta)=a _ 1b _ 1+\dots+a _ rb _ r-a _ {r+1}b _ {r+1}-\dots-a _ nb _ n,\]
因为二次型函数(\alpha,\alpha)是一个满秩不定二次型,故V关于此内积成准欧几里得空间.\, 反之,对任意准欧几里得空间V,因为(\alpha,\alpha)是满秩不定二次型函数,根据定理5.3.2,在V内存在一组基,使对称双线性函数(\alpha,\beta)在这组基下的矩阵是G=\mathrm{diag}(1,\dots,1,-1,\dots,-1).\,因而当\alpha=\sum a _ i\varepsilon _ i,\, \beta=\sum b _ i\varepsilon _ i时,
\[(\alpha,\beta)=(a _ 1,\dots,a _ n)G(b _ 1,\dots,b _ n)^{\mathrm{T}}=a _ 1b _ 1+\dots+a _ rb _ r-a _ {r+1}b _ {r+1}-\dots-a _ nb _ n.\]

狭义相对论中,用三个空间坐标和一个时间坐标(实际是ct)来刻画一个物体的运动,称为四维时空空间,在数学上说,就是实数域上的四维向量空间\mathbb{R}^4,其向量表示为(x _ 1,x _ 2,x _ 3,x _ 4)\, (x _ 4=ct).\, 根据物理上的考虑,在四维时空空间定义内积:若\alpha=(x _ 1,\dots,x _ 4),\, \beta=(y _ 1,\dots,y _ 4),则
\[(\alpha,\beta)=x _ 1y _ 1+x _ 2y _ 2+x _ 3y _ 3-x _ 4y _ 4.\]
I=\mathrm{diag}(1,1,1,-1),取定基\varepsilon _ 1=(1,0,0,0),\dots,\varepsilon _ 4=(0,0,0,1).\, 那么(\alpha,\beta)=X^{\mathrm{T}}IY.\, I为对称矩阵,故(\alpha,\beta)为对称双线性函数,在基\varepsilon _ 1,\dots,\varepsilon _ 4下的矩阵为I.\, 显然\mathbb{R}^4关于此内积成准欧几里得空间.\, 现在(\alpha,\alpha)不一定非负,所以向量长度、夹角的概念不再有意义.

经典力学使用保持空间向量长度和夹角不变的变换,即三维几何空间中的正交变换,而在狭义相对论中使用变换:\alpha=(x _ 1,\dots,x _ 4)^{\mathrm{T}},\, \boldsymbol{A}\alpha=(x' _ 1,\dots,x' _ 4)^{\mathrm{T}},应有{x' _ 1}^2+{x' _ 2}^2+{x' _ 3}^2-c^2{t'}^2=x _ 1^2+x _ 2^2+x _ 3^2-c^2t^2,而这表明
(\boldsymbol{A}\alpha,\boldsymbol{A}\alpha)=(\alpha,\alpha),等价于(\boldsymbol{A}\alpha,\boldsymbol{A}\beta)\equiv(\alpha,\beta).

Definition 48.\boldsymbol{A}为四维时空空间\mathbb{R}^4内的一个广义洛仑兹(Lorentz)变换,若(\boldsymbol{A}\alpha,\boldsymbol{A}\beta)\equiv(\alpha,\beta).

Theorem 49. \boldsymbol{A}为广义洛仑兹变换等价于A^{\mathrm{T}}IA=I等价于AIA^{\mathrm{T}}=I.

Theorem 50. 若广义洛仑兹变换在某组基下的矩阵为A=(a _ {ij}),则|a _ {44}|\geqslant1.

狭义相对论一个基本假设是物体的运动速度小于光速c.

Definition 51. 称四维时空空间内一个向量(x _ 1,x _ 2,x _ 3,ct)为类时向量,若x _ 1^2+x _ 2^2+x _ 3^2-c^2t^2<0.而t0的大小关系分别对应过去、现在和将来,故t>0时称为正类时向量.

Definition 52. 对广义洛仑兹变换\boldsymbol{A},称\boldsymbol{A}为洛仑兹变换,如果它在基\varepsilon _ 1,\dots,\varepsilon _ 4下的矩阵A满足a _ {44}\geqslant1.

Theorem 53. 四维时空内广义洛仑兹变换是洛仑兹变换的充要条件是它总把正类时向量变为正类时向量.

Theorem 54. 如果把四维时空空间内全体洛仑兹变换所成集合记作L,则

1\boldsymbol{E}\in L;\quad(2\boldsymbol{A},\boldsymbol{B}\in L,则\boldsymbol{AB}\in L;\quad(3\boldsymbol{A}\in L可逆,且\boldsymbol{A}^{-1}\in L.

对定理theorem641,设\boldsymbol{A}\alpha=(\varepsilon _ 1,\dots,\varepsilon _ 4)AX,\, \boldsymbol{A}\beta=(\varepsilon _ 1,\dots,\varepsilon _ 4)AY,那么(\boldsymbol{A}\alpha,\boldsymbol{A}\beta)=(AX)^{\mathrm{T}}I(AY)=X^{\mathrm{T}}(A^{\mathrm{T}}IA)Y,故\boldsymbol{A}为广义洛仑兹变换等价于A^{\mathrm{T}}IA=I.\, 而
A^{\mathrm{T}}IA=I等价于A^{\mathrm{T}}IAI=E等价于IAIA^{\mathrm{T}}=E等价于AIA^{\mathrm{T}}=I.

对定理theorem642,现在有A^{\mathrm{T}}IA=I,考察其第4行第4列,得
\[a _ {14}^2+a _ {24}^2+a _ {34}^2-a _ {44}^2=-1\Longrightarrow a _ {44}^2=1+a _ {14}^2+a _ {24}^2+a _ {34}^2\geqslant1.\]

对定理theorem643,若\alpha=(x _ 1,\dots,x _ 4)是正类时向量,而\boldsymbol{A}\alpha=(x' _ 1,\dots,x' _ 4),因为\boldsymbol{A}是广义洛仑兹变换。故{x' _ 1}^2+{x' _ 2}^2+{x' _ 3}^2-{x' _ 4}^2=x _ 1^2+x _ 2^2+x _ 3^2-x _ 4^2<0,所以\boldsymbol{A}\alpha仍是类时向量.\, 现在
\[x' _ 4=a _ {41}x _ 1+a _ {42}x _ 2+a _ {43}x _ 3+a _ {44}x _ 4.\]

可以证明|a _ {41}x _ 1+a _ {42}x _ 2+a _ {43}x _ 3|<|a _ {44}x _ 4|.\, 事实上
(a _ {41}x _ 1+a _ {42}x _ 2+a _ {43}x _ 3)^2\leqslant(a _ {41}+a _ {42}+a _ {43})^2(x _ 1+x _ 2+x _ 3)^2<(a _ {44}^2-1)x _ 4^2<a _ {44}^2x _ 4^2.

如果\boldsymbol{A}是洛仑兹变换,则a _ {44}\geqslant1,又x _ 4>0,故x' _ 4=a _ {41}x _ 1+a _ {42}x _ 2+a _ {43}x _ 3+a _ {44}x _ 4>0,即\boldsymbol{A}\alpha仍为正类时向量.\, 反之,如果x' _ 4 a _ {41}x _ 1+a _ {42}x _ 2+a _ {43}x _ 3+a _ {44}x _ 4>0,则a _ {44}必为正数,故a _ {44}\geqslant 1\boldsymbol{A}为洛仑兹变换.

从上文还可以看出洛仑兹变换也总把“负类时向量”变为“负类时向量”.

对定理theorem644(\boldsymbol{AB}\alpha,\boldsymbol{AB}\alpha)=(\boldsymbol{B}\alpha,\boldsymbol{B}\alpha)=(\alpha,\alpha)
\boldsymbol{AB}为广义洛仑兹变换.\, 显然它又把正类时向量总变为正类时向量,故为洛仑兹变换.\, \boldsymbol{A}的矩阵A满足A^{\mathrm{T}}IA=I,取行列式有|A|^2=1,故\boldsymbol{A}可逆,
(\boldsymbol{A}^{-1}\alpha,\boldsymbol{A}^{-1}\beta)
=(\boldsymbol{A}\boldsymbol{A}^{-1}\alpha,\boldsymbol{A}\boldsymbol{A}^{-1}\beta)=(\alpha,\beta)
,故\boldsymbol{A}^{-1}为广义洛仑兹变换.\, 设\alpha为正类时向量但\boldsymbol{A}^{-1}\alpha不是,则由\boldsymbol{A}为洛仑兹变换知\boldsymbol{A}\boldsymbol{A}^{-1}\alpha=\alpha不是正类时向量,矛盾.\, 故\boldsymbol{A}^{-1}也是洛仑兹变换.
5.0.2. 辛空间 本段的目的,是讨论复数域上线性空间引进度量性质的另一种方法,它与酉空间大不相同,但同样有广泛的应用.

n维线性空间V,反对称线性函数f(\alpha,\beta)在任一组基下的矩阵都是反对称矩阵,于是|A|=(-1)^n|A|.\, 当n是奇数时得|A|=0,说明奇数维线性空间中的反对称双线性函数不可能是满秩的.\, 设V维数为偶数,取一组基\varepsilon _ 1,\dots,\varepsilon _ {2m},则(f(\varepsilon _ i,\varepsilon _ j))2m阶满秩方阵.\, 首先,任取V内非零向量\alpha,必可找到\beta,使f(\alpha,\beta)\neq0.\, 否则f(\alpha,\varepsilon _ j)=f(\sum x _ i\varepsilon _ i,\varepsilon _ j)=\sum x _ if(\varepsilon _ i,\varepsilon _ j)\equiv 0,这是一个系数矩阵满秩的齐次线性方程组,只有零解
x _ 1=\dots=x _ {2m}=0,则\alpha=0,矛盾.\, 此外,f(\alpha,\beta)反对称说明f(\alpha,\alpha)=0.

V\mathbb{C}n=2m维线性空间,而f(\alpha,\beta)V内一个满秩反对称双线性函数,定义内积(\alpha,\beta)=f(\alpha,\beta),就称具有这种内积的线性空间为辛空间.

{辛基}

Theorem 55.n=2m维辛空间内存在一组基,其度量矩阵为
\[G=
\begin{bmatrix}
A & & & \\
& A & & \\
& & \ddots & \\
& & & A
\end{bmatrix},\quad A=\begin{bmatrix}
0 & 1 \\
-1 & 0
\end{bmatrix}.
\]
这样的基称为第一类辛基.

Corollary 56. 存在一组基,其度量矩阵为
\[\begin{bmatrix}
0 & E _ m \\
-E _ m & 0
\end{bmatrix}.\]
这种基称为第二类辛基.

m作数学归纳法.\, m=1时,由于内积满秩、反对称,故(\varepsilon _ 1,\varepsilon _ 1)=(\varepsilon _ 2,\varepsilon _ 2)=0,\, (\varepsilon _ 1,\varepsilon _ 2)=k\neq0,令\eta _ i=\varepsilon _ i/\sqrt{k}即可(\sqrt{k}k的任一平方根).

设命题对2(m-1)维辛空间成立(m\geqslant2),任取\varepsilon _ 1\in V,存在\varepsilon _ 2\in V使(\varepsilon _ 1,\varepsilon _ 2)=k\neq0,按上面讨论知可取k=1.\, 令M=\{\, \alpha\in V\mid(\alpha,\varepsilon _ i)=0,\, i=1,2\, \},显然为V子空间.\, 若\alpha=k _ 1\varepsilon _ 1+k _ 2\varepsilon _ 2\in M,则(\alpha,\varepsilon _ 2)=k _ 1(\varepsilon _ 1,\varepsilon _ 2)=0,\, k _ 1=0,同样k _ 2=0,那么M\cap L(\varepsilon _ 1,\varepsilon _ 2)=\{0\},而\varepsilon _ 1,\varepsilon _ 2显然线性无关,扩充成V的一组基\varepsilon _ 1,\dots,\varepsilon _ n.
\alpha=\sum x _ i\varepsilon _ i,齐次线性方程组(\varepsilon _ 1,\alpha)=\sum x _ i(\varepsilon _ 1,\varepsilon _ i)=0,\, (\varepsilon _ 2,\alpha)=\sum x _ i(\varepsilon _ 2,\varepsilon _ i)=0的系数矩阵为这组基度量矩阵的前两行,秩为2,因而其解空间是\mathbb{C}^nn-2维子空间,由同构知\dim M=n-2,于是V=L(\varepsilon _ 1,\varepsilon _ 2)\oplus M.\, 现在M内取一组基,并上\varepsilon _ 1,\varepsilon _ 2成为V的基,V的内积在此组基下的度量矩阵成准对角形G _ 1=\mathrm{diag}(A,G _ 2).\, 内积限制在M内,前面取的基下度量矩阵G _ 2.\, 因G _ 1满秩,故G _ 22(m-1)阶满秩反对称矩阵,表明内积限制在M内是一满秩反对称双线性函数,因而M关于这内积是一个2(m-1)维辛空间,按归纳假设存在M一组基\eta _ 3,\dots,\eta _ n,内积在此基下度量矩阵为G的形式,故V的内积在基\eta _ 1=\varepsilon _ 1,\eta _ 2=\varepsilon _ 2,\eta _ 3,\dots,\eta _ n下度量矩阵为G.\, 第一类辛基调换下顺序就得到第二类辛基.

{共轭变换、(反)对称变换、辛变换}
a

f(\alpha,\beta)=(\boldsymbol{A}\alpha,\beta)=(AX)^{\mathrm{T}}GY,\, g(\alpha,\beta)=(\alpha,\boldsymbol{A}\beta)=X^{\mathrm{T}}G(BY),那么:\boldsymbol{B}\boldsymbol{A}的共轭变换,即f(\alpha,\beta)\equiv g(\alpha,\beta),即A^{\mathrm{T}}G=GB,即B=G^{-1}A^{\mathrm{T}}G.

由此可知辛空间任一线性变换的共轭变换是存在唯一的,其矩阵为B=G^{-1}A^{\mathrm{T}}G.\, 同时又有B^{\mathrm{T}}G=GA,表示
(\boldsymbol{A} ^*)^*=\boldsymbol{A}.

B=A,得:\boldsymbol{A}是对称变换充要条件为A^{\mathrm{T}}G=GA.

反对称变换即\boldsymbol{A}^*=-\boldsymbol{A},亦即(\boldsymbol{A}\alpha,\beta)=-(\alpha,\boldsymbol{A}\beta).\, 得\boldsymbol{A}为反对称变换的充要条件为A^{\mathrm{T}}G=-GA.

Definition 57.n=2m维辛空间V内一线性变换\boldsymbol{R}为辛变换,如果(\boldsymbol{R}\alpha,\boldsymbol{R}\beta)\equiv(\alpha,\beta).

Theorem 58. a
  • \boldsymbol{R}是辛变换的充要条件是,\boldsymbol{R}可逆且\boldsymbol{R}^*=\boldsymbol{R}^{-1}
  • \boldsymbol{R}是辛变换的充要条件是,R^{\mathrm{T}}GR=G.

对辛变换,(\boldsymbol{R}\alpha,\boldsymbol{R}\beta)=(\alpha,\boldsymbol{R}^*\boldsymbol{R}\beta)=(\alpha,\beta),则
(\alpha,(\boldsymbol{R}^*\boldsymbol{R}-\boldsymbol{E})\beta)\equiv0.\, 由\alpha任意性知
(\boldsymbol{R}^*\boldsymbol{R}-\boldsymbol{E})\beta=0,再由\beta任意性知\boldsymbol{R}^*\boldsymbol{R}=\boldsymbol{E}.\, 于是\boldsymbol{R}可逆且\boldsymbol{R}^*=\boldsymbol{R}^{-1}.\, 反过来是显然的.

\boldsymbol{R}为辛变换,则\boldsymbol{R}^*矩阵为R^{-1},则R^{-1}=G^{-1}R^{\mathrm{T}}G,立得R^{\mathrm{T}}GR=G.\, 反过来R^{\mathrm{T}}GR=G时由G满秩知R满秩,R^{-1}=G^{-1}R^{\mathrm{T}}G,故\boldsymbol{R}^{-1}=\boldsymbol{R}^*.

在第一类辛基下,度量矩阵G成准对角形,矩阵R满足R^{\mathrm{T}}GR=G,这样的矩阵成为辛矩阵.

{辛平移}
a

下面是一类重要的辛变换.\, 取定复数c和一非零向量\varepsilon,定义线性变换\boldsymbol{T}\alpha=\alpha+c(\alpha,\varepsilon)\varepsilon.
\begin{align*}
(\boldsymbol{T}\alpha,\boldsymbol{T}\beta) & =(\alpha+c(\alpha,\varepsilon)\varepsilon,\beta+c(\beta,\varepsilon)\varepsilon) \\
& =(\alpha,\beta)+c(\alpha,\varepsilon)(\varepsilon,\beta)+c(\beta,\varepsilon)(\alpha,\varepsilon)+0\\
& =(\alpha,\beta)-c(\alpha,\varepsilon)(\beta,\varepsilon)+c(\beta,\varepsilon)(\alpha,\varepsilon)\\
& =(\alpha,\beta).
\end{align*}
\boldsymbol{T}V内一辛变换,称为V的辛平移.\, 如果(\alpha,\varepsilon)=0,则\boldsymbol{T}\alpha=\alpha.\, 特别地,辛空间中\boldsymbol{T}\varepsilon=\varepsilon.

Theorem 59.\varepsilon2m维辛空间V内一非零向量,
  1. \boldsymbol{T}(c _ 1,\varepsilon)\boldsymbol{T}(c _ 2,\varepsilon)=\boldsymbol{T}(c _ 1+c _ 2,\varepsilon)
  2. \boldsymbol{R}\boldsymbol{T}(c,\varepsilon)\boldsymbol{R}^{-1}=\boldsymbol{T}(c,\boldsymbol{R}\varepsilon)
  3. \boldsymbol{T}(c,a\varepsilon)=\boldsymbol{T}(a^2c,\varepsilon)\, (a\neq0).


评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注