二次型

数域P上的一个n元二次型

\[f(x_1,x_2,...,x_n)=\sum_{i=1}^n\sum_{j=1}^na_{ij}x_ix_j\]

数域P上任意一个二次型都可以经过非退化的线性替换变成平方和的形式
并称该平方和形式为该二次型的标准型

证明

设n为变量数

使用数学归纳法 $n=1时$

\[f(x _{1}) = a _{11} ^{2}\]

假设对n - 1 个变量的情形成立

n个变量时

\[f(x _{1} ,x _{2} ,x _{3} , \cdots ,x _{n} ) = \sum_{i = 1}^{n}\sum_{j=1}^{n}a _{ij} x _{i} x _{j}\]

分三种情形来讨论

Case 1

$a _{ii}$中至少有一个不为$0$,不妨设$a _{11}$ 不为零,这时 $$ \begin{align} f(x _{1},x _{2},...,x _{3}) &= a _{11} x _{1} ^2 +\sum_{j=2}^{n}a _{1j}x _{1} x _{2} + \sum_{i=2}^{n}a _{i1} x _{i} x _{1} +\sum_{i= 2}^{n} \sum_{j=2}^{n} x _{i} x _{j}\\ &= a _{11} x _{1} ^2 +2\sum_{j=2}^{n}a _{1j}x _{1} x _{2} +\sum_{i= 2}^{n} \sum_{j=2}^{n} x _{i} x _{j} \\ &= a _{11} (x _{1} + \sum_{j=2}^{n}a _{11}^{-1} a _{1j}x _{1} x _{j} )^2 - (\sum_{i = 2}^{n}a _{1j} x _{j} )^2 +\sum_{i = 2}^{n}\sum_{j= 2}^{n}a _{ij} x _{i} x _{j} \end{align} $$

其中 $\sum_{i= 2}^{n} \sum_{j=2}^{n}a _{ij} x _{i} x _{j}$
是 $x _{2},x _{3} ,x _{4}$的二次型

\[\begin{cases} y_1 = x _{1} + \sum_{j =2}^{n}a _{11} a _{1j}x _{j} &\text{}\\ y _{2} = x_2 \\ \vdots \\ y_n = x_n &\text{}\\ \end{cases} \\\]

\[\begin{cases} x_1 = y _{1} - \sum_{j =2}^{n}a _{11} a _{1j}x _{j} &\text{}\\ x _{2} = y_2 \\ \vdots \\ x_n = y_n &\text{}\\ \end{cases} \\\]

这是一个非退化线性替换

\[s.t. f(x_1,x_2,...,x_n)=a _{11}y _{1} ^2+\sum_{i=2}^{n}b _{ij} y_iy_j.\]

根据MI假设,对 $ \sum_{i=2}^{n}b _{ij} y_iy_j $, 有非退化线性替换

\[\begin{pmatrix} z_1\\ z_2\\ ...\\ z_n\\ \end{pmatrix}=\begin{pmatrix} c_{11}&c_{12}&\cdots&c_{14} \\ c_{21}&c_{22}&\cdots&c_{24} \\ \vdots&\vdots&&\vdots \\ c_{41}&c_{42}&\cdots&c_{44} \\ \end{pmatrix}\\ s.t.\\ f(x_1,x_2,...,x_n) = a _{11} z_1 ^2 + z_2 ^2 + ...+z_n ^2\]

Case 2

$\forall i,a _{ii} = 0$,but $\exists i,s.t. \ a _{1j}=0$

不失一般性,设 $a _{12} \neq 0$

\[\begin{cases} x_1 = z_1 + z_2\\ x_2 = z_1 - z_2\\ x_3 = z_3\\ ...\\ x_n= z_n \end{cases}\]

他是非退化线性替换,且使

\[f(x_1,x_2,..,x_n)= 2a _{12}x_1 x_2 +...\\ =2a _{12} (z_1 + z_2)(z_1-z_2)+...\\ =2 a _{12}z_1 ^2-2a _{12} z_2 ^2\]

且 $ z_1 ^2 $的系数不为0,属于第一种情况,成立.

Case 3

$a _{11} =a _{12}=…=a _{1n}=0$

由对称性,

$a_{11} = a _{21}=…=a _{n1}$

为 $x_2,x_3,…,x_n的二次型$

由归纳假设,可表示为平方和的形式.

至此原命题证毕 #

二次型的矩阵

\[A = \begin{pmatrix} a_{11}&a_{12}&\cdots&a_{14} \\ a_{21}&a_{22}&\cdots&a_{24} \\ \vdots&\vdots&&\vdots \\ a_{41}&a_{42}&\cdots&a_{44} \\ \end{pmatrix}\\ f(x_1,x_2,...,x_n)= \begin{pmatrix} x_1&x_2&...&x_n \end{pmatrix} \begin{pmatrix} a_{11}&a_{12}&\cdots&a_{14} \\ a_{21}&a_{22}&\cdots&a_{24} \\ \vdots&\vdots&&\vdots \\ a_{41}&a_{42}&\cdots&a_{44} \\ \end{pmatrix}\begin{pmatrix} x_1\\ x_2\\ \vdots \\ x_n \end{pmatrix}\\ = C ^{'}AC\]

定理2
在数域P上,任何一个对称矩阵都合同于一个对角矩阵,并称

证明:

将上述证明以矩阵形式写出即可.

使用同前面证明类似的数学归纳法

$
1.a _{ii}不全为0时
$

不失一般性,设 $a _{11} \neq 0 $

应用变换
\(C_1 = \begin{pmatrix} 1& -a _{11}^{-1} a _{12} & ...&-a _{11}^{-1}a _{1n}\\ 0&1&...&0\\ \vdots &\vdots & &\vdots\\ 0&0&...&1 \end{pmatrix}\)

合同变换为

$C^{‘}AC$

\(\alpha = \begin{pmatrix} a _{12} \cdots a _{1n} \end{pmatrix}\\ A_1 = \begin{pmatrix} a_{22}&\cdots&a_{24} \\ \vdots&&\vdots \\ a_{42}&\cdots&a_{44} \\ \end{pmatrix}\)

于是C,A,C’都可以写成分块形式:

\(A = \begin{pmatrix} a _{11} &\alpha \\ \alpha ' &A_1 \end{pmatrix} C =\begin{pmatrix} 1&-a _{11} ^{-1} \alpha \\ 0&E_n \end{pmatrix}\)

\[\begin{array} \\C'AC = \\ \begin{pmatrix} 1&0\\ -a _{11} ^{-1} &E _{n} \end{pmatrix}\begin{pmatrix} a _{11} & \alpha \\ \alpha '&A _{1} \end{pmatrix}\begin{pmatrix} 1&-a _{11} \alpha \\ 0&E_n \end{pmatrix} \end{array}\\=\begin{pmatrix} 1&0\\ -a _{11} ^{-1} &E _{n} \end{pmatrix}\begin{pmatrix} a _{11} &0\\\alpha '&A_1-a _{11}^{-1} \alpha \alpha ' \end{pmatrix}\\=\begin{pmatrix}a _{11} & 0\\ 0& A_1 -a _{11} ^{-1} \alpha \alpha ' \end{pmatrix}\]

$A_1-a _{11}^{-1} \alpha \alpha ‘$ 是一个n-1级对称方矩阵,

由归纳假设,可由可逆矩阵G使
\(G'(A_1-a _{11}^{-1} \alpha \alpha ')G = D\)

为对角矩阵


\(C_2 = \begin{pmatrix} 1&0\\ 0&G \end{pmatrix} \\ C_2'C_1'AC_1C_2=\begin{pmatrix} 1&0\\ 0&G' \end{pmatrix}\begin{pmatrix}a _{11} & 0\\ 0& A_1 -a _{11} ^{-1} \alpha \alpha ' \end{pmatrix}\begin{pmatrix} 1&0\\ 0&G' \end{pmatrix}\\=\begin{pmatrix} 1&0\\0&D \end{pmatrix}为对角矩阵\\ C_1C_2即为所求可逆矩阵\)
2.
$a _{ii} \equiv 0 , \forall i,
\exists a _{1i} \neq 0$

应用变换

\[C = \begin{pmatrix} 1 & -1 &0&\cdots& 0 \\ 1 & 1 &0&\cdots& 0 \\ 0&0&1&...&0 \\ \vdots&\vdots&\vdots &&\vdots \\ 0 & 0 &0&\cdots& 1 \\ \end{pmatrix}\]

\[C'AC = \begin{pmatrix} 2a _{12}&0&...\\ 0&-2a _{12}&...\\ ...&...&... \end{pmatrix}\]

转化为第一种情况.

3.$\forall i ,a _{1i} = a _{i1}=0$

矩阵写为

\(\begin{pmatrix} 0&0\\ 0&A_1 \end{pmatrix}\)
其中$A_1$为n-1个变量的对称矩阵,由归纳假设,与对角矩阵合同.

至此原命题证毕.#

唯一性

在一般的数域内,二次型的标准形不是唯一的,而与所作的非退化线性替换有关.

复数域情形

$f(x_1,x_2,…,x_n)$是复数域内的一个二次型,由上述定理1,可经可逆线性替换变为标准型

不妨假设为
\(d_1 y_1 ^2 d_2 y_2 ^2 + ... + d_r y_r ^2 \\ d_i \neq 0,i = 1,2,...,r.\)

r就是二次型的秩

再通过可逆线性替换(注意复数总可以开平方)
\(\begin{cases} y_1 = \frac{1}{\sqrt{d_1}}z_1 &\text{}\\ y_2 = \frac{1}{\sqrt{d_2}}z_2 &\text{}\\ ...\\ y_r = \frac{1}{\sqrt{d_r}}z_n\\ y _{r+1} = z _{r+1} \\ ...\\ y_n = z_n \end{cases}\)
即得
\(z_1 ^2+z_2 ^2 + ...+z_n ^2\)

称为复二次型$f(x_1,…,x_n)$的规范形,显然,在复数域内,规范性完全由原二次型矩阵的秩决定

定理3
任意一个复二次型可经非退化线性变换化为唯一确定的规范形.

或者说,任意复数域内的对称矩阵合同于一形如 $ \begin{pmatrix}
1&0&…\
0&1&…\
0&0&…
\end{pmatrix} $的对角矩阵.

推论
两个复数矩阵合同的充要条件是他们的秩相等

####实数域情形

$f(x_1,x_2,…,x_n)$是一实二次型,由定理一,经非退化线性替换,再适当排列文字的次序,得
\(d _{1} y_1 ^2+d_2 y_2 ^2 + ...+d_p y_p - d_{p+1}- d _{p+1} ^2 ... - d _r y_r ^2\)
其中 $d_i > 0 ,i = 1,2,…,r ,r = rank(A)$

\(\begin{cases} y_1 = \frac{1}{\sqrt{d_1}}z_1 &\text{}\\ y_2 = \frac{1}{\sqrt{d_2}}z_2 &\text{}\\ ...\\ y_r = \frac{1}{\sqrt{d_r}}z_n\\ y _{r+1} = z _{r+1} \\ ...\\ y_n = z_n \end{cases}\)
就得到
\(z_1 ^2 + z_2 ^2 + ... + z_p ^2 -z _{p+1} ^2 - ... - z_r ^2\)
称为实二次型 $f(x_1,x_2,…x_n)$的规范形,显然,它完全被r,p两个数决定.

定理4
任意一个实二次型可经过适当的非退化线性替换可化为唯一确定的规范形

前半部分(可化为规范型)已经证明,下证唯一性

设实二次型$f(x_1,x_2,…,x_n)$经非退化的线性替换

\[X= BY\]

化为规范型

\[y_1 ^2+ y_2 ^2 + \cdots + y_p^2- \cdots - y_r ^2\]

经非退化线性替换

\[X = CZ\]

化为规范型

\[z_1 ^2 +z_2 ^2 + \cdots z_p ^2 - \cdots - z_r ^2\]

用反证法.设p>q.

由以上假设,我们有

\[y_1 ^2+ y_2 ^2 + \cdots + y_p^2- \cdots - y_r ^2 = z_1 ^2 +z_2 ^2 + \cdots z_p ^2 - \cdots - z_r ^2 \tag{*}\]

其中 $Z = C^{-1}BY\tag{1}$


\(\begin{pmatrix} g_{11}&g_{12}&\cdots&g_{1n} \\ g_{21}&g_{22}&\cdots&g_{2n} \\ \vdots&\vdots&&\vdots \\ g_{n1}&g_{n2}&\cdots&g_{nn} \\ \end{pmatrix}\)

所以(1)可以写成

\[\begin{cases} z_1 = g_{11} y_1 + g_{12}y_2+ \cdots +g_{1n}y_n ,\\ z_2 = g_{21} y_2 + g_{22}y_2+ \cdots +g_{2n}y_n, \\ \cdots\\ z_n = g_{n1}y_1+ g_{n2}y_2+ \cdots +g_{nn}y_n \end{cases} \tag{2}\]

考虑齐次线性方程组

这里的思路来自北大《高等代数》(第四版 北京大学前代数小组 高等教育出版社)个人认为一定程度上缺少直觉性.

\[\begin{cases} g_{11}y_1+g_{12}y_2+ \cdots+g_{1n}y_n = 0,\\ \cdots \\ g_{q1}y_1+g_{q2}y_2+ \cdots+g_{qn}y_n = 0,\\ y _{p+1} = 0,\\ \cdots \\ y_n=0. \end{cases} \tag{3}\]

方程组(3)含有n个未知量,$q+(n-p)=n-(p-q)<n$个方程,故方程组有非零解.令

\[(y_1,...,y_p,y_{p+1},...,y_n) =(k _1,...,k_p,k_{p+1},...,k _n)\]

是(3)的一个非零解.显然

\[k_{p+1}= ...=k _n= 0\]

因此,把它带入(*)的左端,得到的值为

\[k _1 ^2+ k _2 ^2 +...+k _{p} > 0\]

再通过(2)把它带入(*)的右端,因为它是(3)的解,故有

\[z_1=z_2=...=z_q=0\]

所以

\[-z _{q+1} ^2 -z _{q+2} -...-z _{r} ^2 \leqslant 0\]

矛盾.$p\leq q$得证,同理可证$p\geq q$.
于是唯一性得证.
这个定理通常称为 惯性定理.

Updated: