双线性函数与二次型

第五章：双线性函数与二次型 1. 总括本章为在线性空间中引进度量奠定基础.以下几点需要注意：

双线性函数和线性变换的基础知识是互相平行的，这主要是他们的共同点：线性性质所决定.在线性空间取定一组基后，线性变换与双线性函数都由它们在该组基下的作用唯一决定，而这作用则归纳为一个 $n$ 阶方阵.从而线性变换与双线性函数都与 $n$ 阶方阵建立起一一对应.线性变换在两组基下的矩阵是相似关系，双线性函数在两组基下的关系是合同关系.由此完全弄清矩阵的相似与合同的本质.

但也要充分注意线性变换与双线性函数的一个基本不同点.对任一子空间，线性变换未必可以限制在它里面，而对双线性函数，它可以把定义域限制在任一子空间内.因此双线性函数必线性变换显得简单许多.在研讨双线性函数时，应当学会利用这一点，把双线性函数的研究适当地转化到某个子空间来研讨.
对称双线性函数、二次型函数、对称矩阵、二次型这四种概念本质上是等价的，应当掌握在它们之间自由转换这一重要方法.对于对称双线性函数考虑基的变换，对称矩阵则考虑合同变换，二次型则是可逆线性变数替换，它们也是本质上互相等价的.
本章较深入的结果是关于实二次型的理论.实二次型完全由其规范形所决定.根据规范形的类型，实二次型可以划分为五大类.当利用实二次型来在实数域上的线性空间中引进度量时，就是按这五大类来分别讨论.

Contents
Contents
1.  总括
2.  双线性函数
   2.1.  线性与双线性函数
   2.2.  双线性函数在不同基下的矩阵
   2.3.  对称双线性函数
3.  二次型
4.  实与复二次型的分类
   4.1.  复二次型的分类
   4.2.  实二次型的分类
5.  正定二次型

2. 双线性函数 2.1. 线性与双线性函数和定理theorem435对应，双线性函数有如下定理：

Theorem 1.

\dim V=n

双线性函数 $f(\alpha,\beta)$ 由 $f(\varepsilon _ i,\varepsilon _ j)$ 唯一决定.
任给 $K$ 上一 $n$ 阶方阵 $A=(a _ {ij})$ ，确定了唯一的双线性函数 $(\alpha,\beta)$ 使 $f(\varepsilon _ i,\varepsilon _ j)=a _ {ij}$ .

Proposition 2.

V

上双线性函数一一对应于

M _ n(K)

的一个方阵.

Theorem 3. \[X^{\mathrm{T}}AY\equiv X^{\mathrm{T}}BY\Longrightarrow A=B.\]

对于定理theorem511，设 $f(\alpha,\beta)$ 为双线性函数，又设 $\alpha=\sum x _ i\varepsilon _ i,\, \beta=\sum y _ j\varepsilon _ j$ ，那么
\[f(\alpha,\beta)=f(\sum x _ i\varepsilon _ i,\sum y _ j\varepsilon _ j)=\sum x _ i f(\varepsilon _ i,\sum y _ j\varepsilon _ j)=\sum\sum x _ i y _ j f(\varepsilon _ i,\varepsilon _ j).\]

现给定 $A=(a _ {ij})$ 后，设 $\alpha,\beta$ 坐标分别为 $X,Y$ ，可证 $f(\alpha,\beta)=X^{\mathrm{T}}AY$ 满足 $f(\varepsilon _ i,\varepsilon _ j)=a _ {ij}$ 的要求.

对定理theorem512，当 $X^{\mathrm{T}}AY\equiv X^{\mathrm{T}}BY$ 时存在两个双线性函数使 $f(\alpha,\beta)=X^{\mathrm{T}}AY,\, g(\alpha,\beta)=X^{\mathrm{T}}BY$ 且这两个双线性函数恒等，而 $A,B$ 是它们在同一组基下的矩阵，故 $A=B$ .
2.2. 双线性函数在不同基下的矩阵对应于定理theorem4310和定理theorem4311，有：

Theorem 4.

A,B

合同的充分必要条件是它们是一个双线性函数

f(\alpha,\beta)

在两组基下的矩阵.

设 $f(\varepsilon _ i,\varepsilon _ j)=a _ {ij},\, f(\eta _ i.\eta _ j)=b _ {ij},\, A=(a _ {ij}),\, B=(b _ {ij})$ .令
\begin{gather*}
\alpha=(\varepsilon _ 1,\dots,\varepsilon _ n)X,\, \beta=(\varepsilon _ 1,\dots,\varepsilon _ n)Y;\; \alpha=(\eta _ 1,\dots,\eta _ n)\overline{X},\, \beta=(\eta _ 1,\dots,\eta _ n)\overline{X} \\
(\eta _ 1,\dots,\eta _ n)=(\varepsilon _ 1,\dots,\varepsilon _ n)T\Longrightarrow X=T\overline{X},\, Y=T\overline{Y}.
\end{gather*}
代入并由定理theorem512，
\[f(\alpha,\beta)=X^{\mathrm{T}}AY=\smash[b]{\overline{X}}^{\mathrm{T}}T^{\mathrm{T}}AT\overline{Y}=\smash[b]{\overline{X}}^{\mathrm{T}}B\overline{Y}\Longrightarrow B=T^{\mathrm{T}}AT.\]

设 $B=T^{\mathrm{T}}AT,\, T$ 可逆. $\, A$ 可看作一双线性函数在某组基下的矩阵，将 $T$ 作为过渡矩阵把这组基变为另外一组基，则在这组基下的矩阵为 $T^{\mathrm{T}}AT=B$ .
2.3. 对称双线性函数

Proposition 5.

f(\alpha,\beta)

为对称双线性函数等价于

(f(\varepsilon _ i,\varepsilon _ j))

为对称矩阵.从而取定一组基后，全体对称双线性函数和全体对称矩阵建立起一一对应.

给定对称矩阵 $A$ 时， $f(\alpha,\beta)=X^{\mathrm{T}}AY=(X^{\mathrm{T}}AY)=(X^{\mathrm{T}}AY)^{\mathrm{T}}=Y^{\mathrm{T}}A^{\mathrm{T}}X=Y^{\mathrm{T}}AX=f(\beta,\alpha)$ .

Proposition 6. 对称双线性函数唯一决定其二次型函数，二次型函数也唯一决定对称双线性函数.

\begin{gather*}
Q _ f(\alpha+\beta)=f(\alpha+\beta,\alpha+\beta)=f(\alpha,\alpha)+2f(\alpha,\beta)+f(\beta,\beta)=Q _ f(\alpha)+2f(\alpha,\beta)+Q _ f(\beta) \\
f(\alpha,\beta)=\frac12[Q _ f(\alpha+\beta)-Q _ f(\alpha)-Q _ f(\beta)]
\end{gather*}

Theorem 7.

f(\alpha,\beta)

为对称双线性函数，则存在一组基，使

f(\alpha,\beta)

在这组基下的矩阵成对角形.

Corollary 8. 任意对称矩阵必定合同于对角矩阵.

定理7是对称双线性函数的基本定理，如果用矩阵方法或用二次型函数的解析表达式进行配方的办法是较繁琐的，而使用对称双线性函数的语言，利用它可以限制在任任意子空间内的事实，可较简单地用数学归纳法证明.

表面上看似乎可以将对称双线性函数看作向量内积，直接用施密特正交化的方法得到一组正交基即证，但事实上向量内积有一点关键的不同之处是向量与自身的内积非负，且为零当且仅当本身为零向量，这才保证施密特正交化的每一步可以进行，因为中间过程出现分母为向量自身作内积的情形；但 $f(\varepsilon _ i,\varepsilon _ j)$ 并不保证非零.

当维数 $n=1$ 时定理显然，设对 $n-1$ 维成立，证对 $n$ 维成立.（直接使用归纳假设是不行的，因为若对一 $n-1$ 维子空间取定了一组基 $\varepsilon _ 1,\dots,\varepsilon _ {n-1}$ 使 $f(\alpha,\beta)$ 在这组基下矩阵成对角形，扩充为 $V$ 的一组基 $\varepsilon _ 1,\dots,\varepsilon _ n$ ，作代换得到一组新基 $\varepsilon _ n\rightarrow \varepsilon _ n+k _ 1\varepsilon _ 1+\dots+k _ {n-1}\varepsilon _ {n-1}$ ，其余不变（反过来在不变动前 $n-1$ 个向量的前提下新基的 $\varepsilon _ n$ 也必定能表示成这种形式），那么 $f(\varepsilon _ n+\sum k _ i\varepsilon _ i,\varepsilon _ j)=f(\varepsilon _ n,\varepsilon _ j)+\sum k _ if(\varepsilon _ i,\varepsilon _ j)=f(\varepsilon _ n,\varepsilon _ j)+k _ jf(\varepsilon _ j,\varepsilon _ j)=0\Rightarrow k _ j=-f(\varepsilon _ n,\varepsilon _ j)/f(\varepsilon _ j,\varepsilon _ j)$ ，但无法保证 $f(\varepsilon _ j,\varepsilon _ j)$ 非零）

若 $f(\alpha,\beta)\equiv0$ ，自然成立；若不然，则 $Q _ f(\alpha)\not\equiv0$ .于是可取定 $\eta _ 1$ 使 $f(\eta _ 1,\eta _ 1)\neq0$ .把它扩充为 $V$ 的一组基 $\eta _ 1,\dots,\eta _ n$ .类似施密特正交化的方法，将 $\eta _ 2,\dots,\eta _ n$ 对 $\eta _ 1$ “正交化”：
\[\varepsilon _ 1=\eta _ 1,\; \varepsilon' _ i=\eta _ i-\frac{f(\eta _ 1,\eta _ i)}{f(\eta _ 1,\eta _ 1)}\eta _ 1\, (i>1)\]
这样 $\varepsilon _ 1,\varepsilon' _ 2,\dots,\varepsilon _ n$ 仍是一组基，且
\[f(\varepsilon _ 1,\varepsilon' _ i)=f(\eta _ 1,\eta _ i)-\frac{f(\eta _ 1,\eta _ i)}{f(\eta _ 1,\eta _ 1)}f(\eta _ 1,\eta _ 1)=0.\]
令 $M=L(\varepsilon' _ 2,\dots,\varepsilon' _ n)$ ，则 $f(\alpha,\beta)$ 可看作这个 $n-1$ 维线性空间内的对称双线性函数.显然，对任意 $\alpha\in M,\, f(\alpha,\varepsilon _ 1)=f(\varepsilon _ 1,\alpha)=0$ .对 $M$ 应用归纳假设，在 $M$ 内存在一组基 $\varepsilon _ 2,\dots,\varepsilon _ n$ ，使 $f(\alpha,\beta)$ 在这组基下的矩阵成对角形，即有 $f(\varepsilon _ i,\varepsilon _ j)=d _ i\delta _ {ij}\, (i,j>1)$ ，故 $f(\varepsilon _ i,\varepsilon _ j)=d _ i\delta _ {ij}\, (i,j\geqslant 1)$ .由 $\varepsilon _ 1,\dots,\varepsilon _ n$ 与 $\varepsilon _ 1,\varepsilon' _ 2,\dots,\varepsilon' _ n$ 等价知它也是 $V$ 的一组基，于是 $f(\alpha,\beta)$ 在这组基下的矩阵成对角形.

若 $A$ 为对称方阵，将其看作一对称双线性函数 $f(\alpha,\beta)$ 在一组基下的矩阵；存在另一组基，使 $f(\alpha,\beta)$ 在这组基下的矩阵成对角形 $D$ ，设原基到这组基的过渡矩阵为 $T$ ，则有 $T^{\mathrm{T}}AT=D$ .
3. 二次型

Proposition 9. 两个二次型

f=X^{\mathrm{T}}AX,\, g=X^{\mathrm{T}}BX

恒等，则

A=B

将 $A,B$ 视作对称双线性函数 $f(\alpha,\beta),g(\alpha,\beta)$ 在某组基下的矩阵，则二次型函数 $Q _ f(\alpha),Q _ g(\alpha)$ 在此组基下的解析表达式分别为二次型 $f,g$ ，故由 $f\equiv g$ 知 $Q _ f(\alpha)\equiv Q _ g(\alpha)\Rightarrow f(\alpha,\beta)\equiv g(\alpha,\beta)\Rightarrow A=B$ .

Proposition 10. 每个对称矩阵都可以看作一个二次型的矩阵，命题9又表明不同的二次型有不同的矩阵，故全体二次型与全体对称矩阵间存在一一对应.

可以把二次型 $f=X^{\mathrm{T}}AX\, (A^{\mathrm{T}}=A)$ 看作二次型函数 $Q _ f(\alpha)$ 在一组基下的解析表达式.给定一个可逆矩阵 $T$ ，做过渡矩阵为 $T$ 的基变换后，设 $\alpha$ 在新基下的坐标为 $Y$ ，那么 $Q _ f(\alpha)$ 在新基下的解析表达式为 $Y^{\mathrm{T}}BY\, (B^{\mathrm{T}}=B)$ .另一方面，若 $A,B$ 是对称双线性函数 $f(\alpha,\beta)$ 在两组基下的矩阵，那么就确定了一个可逆矩阵 $T$ ，使 $B=T^{\mathrm{T}}AT$ 且 $X=TY$ ，此时 $Q _ f(\alpha)=X^{\mathrm{T}}AX=Y^{\mathrm{T}}T^{\mathrm{T}}ATY=Y^{\mathrm{T}}BY$ .

上述讨论用函数论的语言，就是：

Theorem 11. 给定二次型

f,g

，矩阵分别为

A,B

，则：存在可逆线性变数替换

X=TY

使

f

变成

g

的充分必要条件是

B,A

合同：

B=T^{\mathrm{T}}AT

Corollary 12. 二次型

f

在可逆线性变数替换

X=TY

下变为

g

，则

f,g

是同一个二次型函数在两组基下的解析表达式.

若经 $X=TY$ 变为 $g$ ，即 $f=X^{\mathrm{T}}AX=Y^{\mathrm{T}}T^{\mathrm{T}}ATY,\, g=Y^{\mathrm{T}}BY$ ，由命题9即知 $B=T^{\mathrm{T}}AT$ .反之，若 $B=T^ {\mathrm{T}}AT$ ，显然有 $f=Y^{\mathrm{T}}T^{\mathrm{T}}ATY=Y^{\mathrm{T}}BY=g$ .

定理7可以用双线性函数、矩阵论、二次型的语言表述，一个成立另两个自动成立.用二次型的语言就是：

Theorem 13. 给定二次型

f

，则存在存在可逆矩阵

T

，使在线性变数替换

X=TY

下此二次型变为标准形.

给定一个具体二次型，如何化为标准形，这问题从现代的观点来看已不是重要内容.
4. 实与复二次型的分类对 $K$ 为复数域和实数域讨论 $K$ 上二次型有多少个不同的等价类.
4.1. 复二次型的分类

Theorem 14. 复数域

\mathbb{C}

上任意一个二次型

f

都等价于如下标准形：

u _ 1^2+u _ 2^2+\dots+u _ r^2

，其中

r

等于

f

的秩.规范形是唯一的.

规范形有二次型的秩唯一决定.秩不同的二次型显然不等价，秩相同的二次型有相同的规范形，因而互相等价.二次型的秩有 $n+1$ 种可能，所以 $\mathbb{C}$ 上的二次型一共有 $n+1$ 个不同的等价类.
4.2. 实二次型的分类

Theorem 15 (惯性定律). 实数域

\mathbb{R}

上任意一个二次型

f

都等价于如下标准形：

u _ 1^2+\dots+u _ p^2-u _ {p+1}^2-\dots-u _ r^2

，其中

r

等于

f

的秩.规范形是唯一的.

这说明，在实二次型里，每个等价类决定于两个非负整数 $r,p\; (0\leqslant p\leqslant r\leqslant n)$ .这就完全解决了实二次型的分类问题.

下面主要看规范形的唯一性.规范性中的 $r$ 等于 $f$ 的秩，唯一确定，只需 $p$ 也唯一确定.

设 $f$ 有两个规范形： $u _ 1^2+\dots+u _ p^2-u _ {p+1}^2-\dots-u _ r^2;\, v _ 1^2+\dots+v _ q^2-v _ {q+1}^2-\dots-v _ r^2$ .由于 $f$ 能经一可逆线性变数替换变为 $U^{\mathrm{T}}D _ 1U$ ，由推论tuilun521，存在一组基 $\eta _ 1,\dots,\eta _ n$ ，当 $\alpha$ 在这组基下的坐标为 $U$ 时， $Q _ f(\alpha)$ 的解析表达式为 $U^ {\mathrm{T}}D _ 1U=u _ 1^2+\dots+u _ p^2-u _ {p+1}^2-\dots-u _ r^2$ ；又存在另一组基 $\omega _ 1,\dots,\omega _ n$ ，当 $\alpha$ 在这组基下的坐标为 $V$ 时， $Q _ f(\alpha)$ 的解析表达式为 $V^ {\mathrm{T}}D _ 2V=v _ 1^2+\dots+v _ q^2-v _ {q+1}^2-\dots-v _ r^2$ .

令 $M=L(\eta _ 1,\dots,\eta _ p),\, N=L(\omega _ {q+1},\dots,\omega _ n)$ .当 $\alpha$ 为 $M$ 中非零向量时，有 $\alpha=\sum _ {i=1}^p u _ i\eta _ i\neq0\Rightarrow Q _ f(\alpha)=\sum u _ i^2>0$ ；当 $\alpha$ 为 $N$ 中向量时，有 $\alpha=\sum _ {i=v+1}^n v _ i\omega _ i\Rightarrow Q _ f(\alpha)=-\sum v _ i\omega _ i\leqslant0$ .这表明 $M\cap N=\{0\}$ ，有
\[n=\dim V\geqslant\dim(M+N)=\dim M+\dim N=p+(n-q)\Longrightarrow p\leqslant q\Longrightarrow q\leqslant p\Longrightarrow p=q.\]
5. 正定二次型如果实二次型正定，则它的规范形为 $y _ 1^2+y _ 2^2+\dots+y _ n^2=Y^{\mathrm{T}}EY$ .

Theorem 16. 实二次型

f=X^{\mathrm{T}}AX

正定等价于：

$A$ 在 $\mathbb{R}$ 内合同于 $E$ ，即存在 $\mathbb{R}$ 上可逆矩阵 $T$ 使 $A=T^{\mathrm{T}}T$ .
$f$ 对应的二次型函数 $Q _ f(\alpha)>0\, (\alpha\neq0)\Longleftrightarrow X^{\mathrm{T}}AX>0\, (X\neq0)$ .

Corollary 17. 若

A

正定，则

|A|=|T^{\mathrm{T}}||T|=|T|^2>0

Theorem 18.

f

正定的充分必要条件是其矩阵

A

的各阶顺序主子式都大于零，即
\[A\begin{Bmatrix}
1 & 2 & \cdots & k \\
1 & 2 & \cdots & k
\end{Bmatrix}>0.\]

必要性： $\mathbb{R}$ 上 $n$ 维线性空间 $V$ 内对称双线性函数 $f(\alpha,\beta)$ 在基 $\varepsilon _ 1,\dots,\varepsilon _ n$ 下矩阵为 $A$ .把 $f(\alpha,\beta)$ 限制在 $M=L(\varepsilon _ 1,\dots,\varepsilon _ k)$ 内，在其基 $\varepsilon _ 1,\dots,\varepsilon _ k$ 下其矩阵为 $A$ 的 $k$ 阶顺序主子式对应的矩阵 $A _ k$ .因为对任意 $M$ 中非零向量 $\alpha$ 有 $Q _ f(\alpha)>0$ ，由定理16及推论tuilun541，
\[A\begin{Bmatrix}
1 & 2 & \cdots & k \\
1 & 2 & \cdots & k
\end{Bmatrix}=|A _ k|>0.\]

充分性：对 $n$ 作数学归纳法.当 $n=1$ 时 $f=a _ {11}x _ 1^2>0\, (x _ 1\neq0)$ ，故 $f$ 正定.设对 $n-1$ 个变量的实二次型命题成立.下面找出 $V$ 的一组基，在这组基下 $f(\alpha,\beta)$ 的矩阵为 $E _ n$ ，即 $A$ 合同于 $E _ n$ .

考察子空间 $M=L(\varepsilon _ 1,\dots,\varepsilon _ {n-1})$ ，把 $f(\alpha,\beta)$ 限制在 $M$ 内，在基 $\varepsilon _ 1,\dots,\varepsilon _ {n-1}$ 下的矩阵为 $A _ {n-1}$ ，其各阶顺序主子式大于零，由归纳假设， $M$ 内任意非零向量 $\alpha$ 有 $Q _ f(\alpha)>0$ .由定理16， $A _ {n-1}$ 合同于 $E _ {n-1}$ ，那么 $M$ 内存在另一组基 $\eta' _ 1,\dots,\eta' _ {n-1}$ ，使 $f(\alpha,\beta)$ 在这组基下的矩阵为 $E _ {n-1}$ .将 $\eta' _ 1,\dots,\eta' _ {n-1}$ 添加 $\xi$ 扩充为 $V$ 的一组基.

现在以及可以利用类似施密特正交化的方法将这组基“正交化”.
\begin{gather*}
\eta _ 1=\eta' _ 1,\dots,\eta _ {n-1}=\eta' _ {n-1}, \\
\begin{split}
\zeta & =\xi-\frac{f(\eta _ 1,\xi)}{f(\eta _ 1,\eta _ 1)}\eta _ 1-\frac{f(\eta _ 2,\xi)}{f(\eta _ 2,\eta _ 2)}\eta _ 2-\dots-\frac{f(\eta _ {n-1},\xi)}{f(\eta _ {n-1},\eta _ {n-1})}\eta _ {n-1} \\
& =\xi-f(\eta _ 1,\xi)\eta _ 1-f(\eta _ 2,\xi)\eta _ 2-\dots-f(\eta _ {n-1},\eta _ {n-1})\eta _ {n-1}.
\end{split}
\end{gather*}
这样 $\eta _ 1,\dots,\eta _ {n-1},\zeta$ 与 $\eta _ 1,\dots,\eta _ {n-1},\xi$ 等价，也是 $V$ 的一组基，且 $f(\eta _ i,\zeta)=f(\eta _ i,\xi)-f(\eta _ i,\xi)f(\eta _ i,\eta _ i)=0$ .此时已有 $f$ 在基 $\eta _ 1,\dots,\eta _ {n-1},\zeta$ 下的矩阵为
\[B=\begin{bmatrix}
E _ {n-1} & 0 \\
0 & f(\zeta,\zeta)
\end{bmatrix}.\]
只需要调整 $f(\zeta,\zeta)$ .

首先可以证明 $f(\zeta,\zeta)>0$ .现在 $B$ 与 $A$ 是 $f(\alpha,\beta)$ 在不同基下的矩阵，故合同，故存在 $\mathbb{R}$ 上可逆矩阵 $T$ ，使 $f(\zeta,\zeta)=|B|=|T|^2|A|>0$ .故可以令
\[\eta _ n=\frac{1}{\sqrt{f(\zeta,\zeta)}}\zeta.\]
有
\begin{align*}
f(\eta _ n,\eta _ i) & =\frac{1}{\sqrt{f(\zeta,\zeta)}}f(\zeta,\eta _ i)=0\; (i<n), \\
f(\eta _ n,\eta _ n) & =\frac{1}{f(\zeta,\zeta)}f(\zeta,\zeta)=1.
\end{align*}

故在 $V$ 的一组基 $\eta _ 1,\dots,\eta _ n$ 下 $f(\alpha,\beta)$ 的矩阵为 $E _ n,\, A$ 合同于 $E$ ，故 $f$ 正定.

实二次型是数学分析中较为简单的一种多元函数，在几何学中 $f(x _ 1,\dots,x _ n)+b _ 1x _ 1+\dots+b _ nx _ n+c=0$ 代表 $\mathbb{R}^n$ 中一个二次超曲面.因此实二次型理论在数学分析和几何学中都有重要的应用.

双线性函数与二次型

评论

发表回复取消回复

双线性函数与二次型

评论

发表回复 取消回复

发表回复取消回复