双线性函数与二次型

我的原文地址

第五章:双线性函数与二次型 1. 总括 本章为在线性空间中引进度量奠定基础.以下几点需要注意:

  1. 双线性函数和线性变换的基础知识是互相平行的,这主要是他们的共同点:线性性质所决定.在线性空间取定一组基后,线性变换与双线性函数都由它们在该组基下的作用唯一决定,而这作用则归纳为一个n阶方阵.从而线性变换与双线性函数都与n阶方阵建立起一一对应.线性变换在两组基下的矩阵是相似关系,双线性函数在两组基下的关系是合同关系.由此完全弄清矩阵的相似与合同的本质.

    但也要充分注意线性变换与双线性函数的一个基本不同点.对任一子空间,线性变换未必可以限制在它里面,而对双线性函数,它可以把定义域限制在任一子空间内.因此双线性函数必线性变换显得简单许多.在研讨双线性函数时,应当学会利用这一点,把双线性函数的研究适当地转化到某个子空间来研讨.

  2. 对称双线性函数、二次型函数、对称矩阵、二次型这四种概念本质上是等价的,应当掌握在它们之间自由转换这一重要方法.对于对称双线性函数考虑基的变换,对称矩阵则考虑合同变换,二次型则是可逆线性变数替换,它们也是本质上互相等价的.

  3. 本章较深入的结果是关于实二次型的理论.实二次型完全由其规范形所决定.根据规范形的类型,实二次型可以划分为五大类.当利用实二次型来在实数域上的线性空间中引进度量时,就是按这五大类来分别讨论.

Contents
Contents
 1.  总括
 2.  双线性函数
   2.1.  线性与双线性函数
   2.2.  双线性函数在不同基下的矩阵
   2.3.  对称双线性函数
 3.  二次型
 4.  实与复二次型的分类
   4.1.  复二次型的分类
   4.2.  实二次型的分类
 5.  正定二次型

2. 双线性函数 2.1. 线性与双线性函数 和定理theorem435对应,双线性函数有如下定理:

Theorem 1. \dim V=n,
    [(i)]
  1. 双线性函数f(\alpha,\beta)f(\varepsilon _ i,\varepsilon _ j)唯一决定.
  2. 任给K上一n阶方阵A=(a _ {ij}),确定了唯一的双线性函数(\alpha,\beta)使f(\varepsilon _ i,\varepsilon _ j)=a _ {ij}.

Proposition 2. V上双线性函数一一对应于M _ n(K)的一个方阵.

Theorem 3. \[X^{\mathrm{T}}AY\equiv X^{\mathrm{T}}BY\Longrightarrow A=B.\]

对于定理theorem511,设f(\alpha,\beta)为双线性函数,又设\alpha=\sum x _ i\varepsilon _ i,\, \beta=\sum y _ j\varepsilon _ j,那么
\[f(\alpha,\beta)=f(\sum x _ i\varepsilon _ i,\sum y _ j\varepsilon _ j)=\sum x _ i f(\varepsilon _ i,\sum y _ j\varepsilon _ j)=\sum\sum x _ i y _ j f(\varepsilon _ i,\varepsilon _ j).\]

现给定A=(a _ {ij})后,设\alpha,\beta坐标分别为X,Y,可证f(\alpha,\beta)=X^{\mathrm{T}}AY满足f(\varepsilon _ i,\varepsilon _ j)=a _ {ij}的要求.

对定理theorem512,当X^{\mathrm{T}}AY\equiv X^{\mathrm{T}}BY时存在两个双线性函数使f(\alpha,\beta)=X^{\mathrm{T}}AY,\, g(\alpha,\beta)=X^{\mathrm{T}}BY且这两个双线性函数恒等,而A,B是它们在同一组基下的矩阵,故A=B.
2.2. 双线性函数在不同基下的矩阵 对应于定理theorem4310和定理theorem4311,有:

Theorem 4. A,B合同的充分必要条件是它们是一个双线性函数f(\alpha,\beta)在两组基下的矩阵.

f(\varepsilon _ i,\varepsilon _ j)=a _ {ij},\, f(\eta _ i.\eta _ j)=b _ {ij},\, A=(a _ {ij}),\, B=(b _ {ij}).令
\begin{gather*}
\alpha=(\varepsilon _ 1,\dots,\varepsilon _ n)X,\, \beta=(\varepsilon _ 1,\dots,\varepsilon _ n)Y;\; \alpha=(\eta _ 1,\dots,\eta _ n)\overline{X},\, \beta=(\eta _ 1,\dots,\eta _ n)\overline{X} \\
(\eta _ 1,\dots,\eta _ n)=(\varepsilon _ 1,\dots,\varepsilon _ n)T\Longrightarrow X=T\overline{X},\, Y=T\overline{Y}.
\end{gather*}
代入并由定理theorem512
\[f(\alpha,\beta)=X^{\mathrm{T}}AY=\smash[b]{\overline{X}}^{\mathrm{T}}T^{\mathrm{T}}AT\overline{Y}=\smash[b]{\overline{X}}^{\mathrm{T}}B\overline{Y}\Longrightarrow B=T^{\mathrm{T}}AT.\]

B=T^{\mathrm{T}}AT,\, T可逆.\, A可看作一双线性函数在某组基下的矩阵,将T作为过渡矩阵把这组基变为另外一组基,则在这组基下的矩阵为T^{\mathrm{T}}AT=B.
2.3. 对称双线性函数

Proposition 5. f(\alpha,\beta)为对称双线性函数等价于(f(\varepsilon _ i,\varepsilon _ j))为对称矩阵.从而取定一组基后,全体对称双线性函数和全体对称矩阵建立起一一对应.

给定对称矩阵A时,f(\alpha,\beta)=X^{\mathrm{T}}AY=(X^{\mathrm{T}}AY)=(X^{\mathrm{T}}AY)^{\mathrm{T}}=Y^{\mathrm{T}}A^{\mathrm{T}}X=Y^{\mathrm{T}}AX=f(\beta,\alpha).

Proposition 6. 对称双线性函数唯一决定其二次型函数,二次型函数也唯一决定对称双线性函数.

\begin{gather*}
Q _ f(\alpha+\beta)=f(\alpha+\beta,\alpha+\beta)=f(\alpha,\alpha)+2f(\alpha,\beta)+f(\beta,\beta)=Q _ f(\alpha)+2f(\alpha,\beta)+Q _ f(\beta) \\
f(\alpha,\beta)=\frac12[Q _ f(\alpha+\beta)-Q _ f(\alpha)-Q _ f(\beta)]
\end{gather*}

Theorem 7. f(\alpha,\beta)为对称双线性函数,则存在一组基,使f(\alpha,\beta)在这组基下的矩阵成对角形.

Corollary 8. 任意对称矩阵必定合同于对角矩阵.

定理7是对称双线性函数的基本定理,如果用矩阵方法或用二次型函数的解析表达式进行配方的办法是较繁琐的,而使用对称双线性函数的语言,利用它可以限制在任任意子空间内的事实,可较简单地用数学归纳法证明.

表面上看似乎可以将对称双线性函数看作向量内积,直接用施密特正交化的方法得到一组正交基即证,但事实上向量内积有一点关键的不同之处是向量与自身的内积非负,且为零当且仅当本身为零向量,这才保证施密特正交化的每一步可以进行,因为中间过程出现分母为向量自身作内积的情形;但f(\varepsilon _ i,\varepsilon _ j)并不保证非零.

当维数n=1时定理显然,设对n-1维成立,证对n维成立.(直接使用归纳假设是不行的,因为若对一n-1维子空间取定了一组基\varepsilon _ 1,\dots,\varepsilon _ {n-1}使f(\alpha,\beta)在这组基下矩阵成对角形,扩充为V的一组基\varepsilon _ 1,\dots,\varepsilon _ n,作代换得到一组新基\varepsilon _ n\rightarrow \varepsilon _ n+k _ 1\varepsilon _ 1+\dots+k _ {n-1}\varepsilon _ {n-1},其余不变(反过来在不变动前n-1个向量的前提下新基的\varepsilon _ n也必定能表示成这种形式),那么f(\varepsilon _ n+\sum k _ i\varepsilon _ i,\varepsilon _ j)=f(\varepsilon _ n,\varepsilon _ j)+\sum k _ if(\varepsilon _ i,\varepsilon _ j)=f(\varepsilon _ n,\varepsilon _ j)+k _ jf(\varepsilon _ j,\varepsilon _ j)=0\Rightarrow k _ j=-f(\varepsilon _ n,\varepsilon _ j)/f(\varepsilon _ j,\varepsilon _ j),但无法保证f(\varepsilon _ j,\varepsilon _ j)非零)

f(\alpha,\beta)\equiv0,自然成立;若不然,则Q _ f(\alpha)\not\equiv0.于是可取定\eta _ 1使f(\eta _ 1,\eta _ 1)\neq0.把它扩充为V的一组基\eta _ 1,\dots,\eta _ n.类似施密特正交化的方法,将\eta _ 2,\dots,\eta _ n\eta _ 1“正交化”:
\[\varepsilon _ 1=\eta _ 1,\; \varepsilon' _ i=\eta _ i-\frac{f(\eta _ 1,\eta _ i)}{f(\eta _ 1,\eta _ 1)}\eta _ 1\, (i>1)\]
这样\varepsilon _ 1,\varepsilon' _ 2,\dots,\varepsilon _ n仍是一组基,且
\[f(\varepsilon _ 1,\varepsilon' _ i)=f(\eta _ 1,\eta _ i)-\frac{f(\eta _ 1,\eta _ i)}{f(\eta _ 1,\eta _ 1)}f(\eta _ 1,\eta _ 1)=0.\]
M=L(\varepsilon' _ 2,\dots,\varepsilon' _ n),则f(\alpha,\beta)可看作这个n-1维线性空间内的对称双线性函数.显然,对任意\alpha\in M,\, f(\alpha,\varepsilon _ 1)=f(\varepsilon _ 1,\alpha)=0.对M应用归纳假设,在M内存在一组基\varepsilon _ 2,\dots,\varepsilon _ n,使f(\alpha,\beta)在这组基下的矩阵成对角形,即有f(\varepsilon _ i,\varepsilon _ j)=d _ i\delta _ {ij}\, (i,j>1),故f(\varepsilon _ i,\varepsilon _ j)=d _ i\delta _ {ij}\, (i,j\geqslant 1).由\varepsilon _ 1,\dots,\varepsilon _ n\varepsilon _ 1,\varepsilon' _ 2,\dots,\varepsilon' _ n等价知它也是V的一组基,于是f(\alpha,\beta)在这组基下的矩阵成对角形.

A为对称方阵,将其看作一对称双线性函数f(\alpha,\beta)在一组基下的矩阵;存在另一组基,使f(\alpha,\beta)在这组基下的矩阵成对角形D,设原基到这组基的过渡矩阵为T,则有T^{\mathrm{T}}AT=D.
3. 二次型

Proposition 9. 两个二次型f=X^{\mathrm{T}}AX,\, g=X^{\mathrm{T}}BX恒等,则A=B.

A,B视作对称双线性函数f(\alpha,\beta),g(\alpha,\beta)在某组基下的矩阵,则二次型函数Q _ f(\alpha),Q _ g(\alpha)在此组基下的解析表达式分别为二次型f,g,故由f\equiv gQ _ f(\alpha)\equiv Q _ g(\alpha)\Rightarrow f(\alpha,\beta)\equiv g(\alpha,\beta)\Rightarrow A=B.

Proposition 10. 每个对称矩阵都可以看作一个二次型的矩阵,命题9又表明不同的二次型有不同的矩阵,故全体二次型与全体对称矩阵间存在一一对应.

可以把二次型f=X^{\mathrm{T}}AX\, (A^{\mathrm{T}}=A)看作二次型函数Q _ f(\alpha)在一组基下的解析表达式.给定一个可逆矩阵T,做过渡矩阵为T的基变换后,设\alpha在新基下的坐标为Y,那么Q _ f(\alpha)在新基下的解析表达式为Y^{\mathrm{T}}BY\, (B^{\mathrm{T}}=B).另一方面,若A,B是对称双线性函数f(\alpha,\beta)在两组基下的矩阵,那么就确定了一个可逆矩阵T,使B=T^{\mathrm{T}}ATX=TY,此时Q _ f(\alpha)=X^{\mathrm{T}}AX=Y^{\mathrm{T}}T^{\mathrm{T}}ATY=Y^{\mathrm{T}}BY.

上述讨论用函数论的语言,就是:

Theorem 11. 给定二次型f,g,矩阵分别为A,B,则:存在可逆线性变数替换X=TY使f变成g的充分必要条件是B,A合同:B=T^{\mathrm{T}}AT.

Corollary 12. 二次型f在可逆线性变数替换X=TY下变为g,则f,g是同一个二次型函数在两组基下的解析表达式.

若经X=TY变为g,即f=X^{\mathrm{T}}AX=Y^{\mathrm{T}}T^{\mathrm{T}}ATY,\, g=Y^{\mathrm{T}}BY,由命题9即知B=T^{\mathrm{T}}AT.反之,若B=T^ {\mathrm{T}}AT,显然有f=Y^{\mathrm{T}}T^{\mathrm{T}}ATY=Y^{\mathrm{T}}BY=g.

定理7可以用双线性函数、矩阵论、二次型的语言表述,一个成立另两个自动成立.用二次型的语言就是:

Theorem 13. 给定二次型f,则存在存在可逆矩阵T,使在线性变数替换X=TY下此二次型变为标准形.

给定一个具体二次型,如何化为标准形,这问题从现代的观点来看已不是重要内容.
4. 实与复二次型的分类K为复数域和实数域讨论K上二次型有多少个不同的等价类.
4.1. 复二次型的分类

Theorem 14. 复数域\mathbb{C}上任意一个二次型f都等价于如下标准形:u _ 1^2+u _ 2^2+\dots+u _ r^2,其中r等于f的秩.规范形是唯一的.

规范形有二次型的秩唯一决定.秩不同的二次型显然不等价,秩相同的二次型有相同的规范形,因而互相等价.二次型的秩有n+1种可能,所以\mathbb{C}上的二次型一共有n+1个不同的等价类.
4.2. 实二次型的分类

Theorem 15 (惯性定律). 实数域\mathbb{R}上任意一个二次型f都等价于如下标准形:u _ 1^2+\dots+u _ p^2-u _ {p+1}^2-\dots-u _ r^2,其中r等于f的秩.规范形是唯一的.

这说明,在实二次型里,每个等价类决定于两个非负整数r,p\; (0\leqslant p\leqslant r\leqslant n).这就完全解决了实二次型的分类问题.

下面主要看规范形的唯一性.规范性中的r等于f的秩,唯一确定,只需p也唯一确定.

f有两个规范形:u _ 1^2+\dots+u _ p^2-u _ {p+1}^2-\dots-u _ r^2;\, v _ 1^2+\dots+v _ q^2-v _ {q+1}^2-\dots-v _ r^2.由于f能经一可逆线性变数替换变为U^{\mathrm{T}}D _ 1U,由推论tuilun521,存在一组基\eta _ 1,\dots,\eta _ n,当\alpha在这组基下的坐标为U时,Q _ f(\alpha)的解析表达式为U^ {\mathrm{T}}D _ 1U=u _ 1^2+\dots+u _ p^2-u _ {p+1}^2-\dots-u _ r^2;又存在另一组基\omega _ 1,\dots,\omega _ n,当\alpha在这组基下的坐标为V时,Q _ f(\alpha)的解析表达式为V^ {\mathrm{T}}D _ 2V=v _ 1^2+\dots+v _ q^2-v _ {q+1}^2-\dots-v _ r^2.

M=L(\eta _ 1,\dots,\eta _ p),\, N=L(\omega _ {q+1},\dots,\omega _ n).当\alphaM中非零向量时,有\alpha=\sum _ {i=1}^p u _ i\eta _ i\neq0\Rightarrow Q _ f(\alpha)=\sum u _ i^2>0;当\alphaN中向量时,有\alpha=\sum _ {i=v+1}^n v _ i\omega _ i\Rightarrow Q _ f(\alpha)=-\sum v _ i\omega _ i\leqslant0.这表明M\cap N=\{0\},有
\[n=\dim V\geqslant\dim(M+N)=\dim M+\dim N=p+(n-q)\Longrightarrow p\leqslant q\Longrightarrow q\leqslant p\Longrightarrow p=q.\]
5. 正定二次型 如果实二次型正定,则它的规范形为y _ 1^2+y _ 2^2+\dots+y _ n^2=Y^{\mathrm{T}}EY.

Theorem 16. 实二次型f=X^{\mathrm{T}}AX正定等价于:
  1. A\mathbb{R}内合同于E,即存在\mathbb{R}上可逆矩阵T使A=T^{\mathrm{T}}T.
  2. f对应的二次型函数Q _ f(\alpha)>0\, (\alpha\neq0)\Longleftrightarrow X^{\mathrm{T}}AX>0\, (X\neq0).

Corollary 17.A正定,则|A|=|T^{\mathrm{T}}||T|=|T|^2>0.

Theorem 18. f正定的充分必要条件是其矩阵A的各阶顺序主子式都大于零,即
\[A\begin{Bmatrix}
1 & 2 & \cdots & k \\
1 & 2 & \cdots & k
\end{Bmatrix}>0.\]

必要性:\mathbb{R}n维线性空间V内对称双线性函数f(\alpha,\beta)在基\varepsilon _ 1,\dots,\varepsilon _ n下矩阵为A.把f(\alpha,\beta)限制在M=L(\varepsilon _ 1,\dots,\varepsilon _ k)内,在其基\varepsilon _ 1,\dots,\varepsilon _ k下其矩阵为Ak阶顺序主子式对应的矩阵A _ k.因为对任意M中非零向量\alphaQ _ f(\alpha)>0,由定理16及推论tuilun541
\[A\begin{Bmatrix}
1 & 2 & \cdots & k \\
1 & 2 & \cdots & k
\end{Bmatrix}=|A _ k|>0.\]

充分性:对n作数学归纳法.当n=1f=a _ {11}x _ 1^2>0\, (x _ 1\neq0),故f正定.设对n-1个变量的实二次型命题成立.下面找出V的一组基,在这组基下f(\alpha,\beta)的矩阵为E _ n,即A合同于E _ n.

考察子空间M=L(\varepsilon _ 1,\dots,\varepsilon _ {n-1}),把f(\alpha,\beta)限制在M内,在基\varepsilon _ 1,\dots,\varepsilon _ {n-1}下的矩阵为A _ {n-1},其各阶顺序主子式大于零,由归纳假设,M内任意非零向量\alphaQ _ f(\alpha)>0.由定理16A _ {n-1}合同于E _ {n-1},那么M内存在另一组基\eta' _ 1,\dots,\eta' _ {n-1},使f(\alpha,\beta)在这组基下的矩阵为E _ {n-1}.将\eta' _ 1,\dots,\eta' _ {n-1}添加\xi扩充为V的一组基.

现在以及可以利用类似施密特正交化的方法将这组基“正交化”.
\begin{gather*}
\eta _ 1=\eta' _ 1,\dots,\eta _ {n-1}=\eta' _ {n-1}, \\
\begin{split}
\zeta & =\xi-\frac{f(\eta _ 1,\xi)}{f(\eta _ 1,\eta _ 1)}\eta _ 1-\frac{f(\eta _ 2,\xi)}{f(\eta _ 2,\eta _ 2)}\eta _ 2-\dots-\frac{f(\eta _ {n-1},\xi)}{f(\eta _ {n-1},\eta _ {n-1})}\eta _ {n-1} \\
& =\xi-f(\eta _ 1,\xi)\eta _ 1-f(\eta _ 2,\xi)\eta _ 2-\dots-f(\eta _ {n-1},\eta _ {n-1})\eta _ {n-1}.
\end{split}
\end{gather*}
这样\eta _ 1,\dots,\eta _ {n-1},\zeta\eta _ 1,\dots,\eta _ {n-1},\xi等价,也是V的一组基,且f(\eta _ i,\zeta)=f(\eta _ i,\xi)-f(\eta _ i,\xi)f(\eta _ i,\eta _ i)=0.此时已有f在基\eta _ 1,\dots,\eta _ {n-1},\zeta下的矩阵为
\[B=\begin{bmatrix}
E _ {n-1} & 0 \\
0 & f(\zeta,\zeta)
\end{bmatrix}.\]
只需要调整f(\zeta,\zeta).

首先可以证明f(\zeta,\zeta)>0.现在BAf(\alpha,\beta)在不同基下的矩阵,故合同,故存在\mathbb{R}上可逆矩阵T,使f(\zeta,\zeta)=|B|=|T|^2|A|>0.故可以令
\[\eta _ n=\frac{1}{\sqrt{f(\zeta,\zeta)}}\zeta.\]

\begin{align*}
f(\eta _ n,\eta _ i) & =\frac{1}{\sqrt{f(\zeta,\zeta)}}f(\zeta,\eta _ i)=0\; (i<n), \\
f(\eta _ n,\eta _ n) & =\frac{1}{f(\zeta,\zeta)}f(\zeta,\zeta)=1.
\end{align*}

故在V的一组基\eta _ 1,\dots,\eta _ nf(\alpha,\beta)的矩阵为E _ n,\, A合同于E,故f正定.

实二次型是数学分析中较为简单的一种多元函数,在几何学中f(x _ 1,\dots,x _ n)+b _ 1x _ 1+\dots+b _ nx _ n+c=0代表\mathbb{R}^n中一个二次超曲面.因此实二次型理论在数学分析和几何学中都有重要的应用.


评论

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注