Hello大家好,我是小希小朋友,這是我第一次在知乎上寫回答/文章,先來混個臉熟=_=

大致瀏覽了一下知乎,好像沒人寫過這公式的詳細總結,剛好我來填這個坑,這篇文章會詳細講解比內-柯西公式的證明與它在證明別的公式中的運用⊙▽⊙。

公式簡介

證明過程

比內-柯西公式的應用(一)(Cauchy恆等式、Cauchy不等式)

比內-柯西公式的應用(二)(行列式上界估計、Hadamard不等式)

1。公式簡介

比內-柯西公式的形式如下,設

\[A=(a_{ij})_{s\times n},B=(b_{ij})_{n\times s}\]

i)若s>n,則|AB|=0;

ii)若s≤n,那麼|AB|等於A的所有s階子式以及B的相應s階子式的乘積之和,即

\[|AB|= \sum_{1\leq<v_1<\cdots<v_s\leq s} A\begin{pmatrix}1,&2,&\cdots&s\\v_1,&v_2,&\cdots&v_s\\\end{pmatrix}\cdot B\begin{pmatrix}v_1,&v_2,&\cdots&v_s\\1,&2,&\cdots&s\\\end{pmatrix}\]

這條公式的意義在於將兩個不規則的矩陣乘積變成規則方陣的乘積之和,在理論上與其它公式證明中具有巨大意義。

2。證明過程

對於第一種情況s>n,因為

rank(AB)\leq rank(A)\leq n<s\\

於是AB不是滿秩矩陣,從而|AB|=0。

也可以這麼來直觀理解:這個s階方陣AB是由比它秩低的方陣生成的,因此不滿秩,從而|AB|=0。

對於第二種情況s≤n,由於A與B均不為方陣,我們希望將它們組成方陣形式,這樣更好處理

\begin{vmatrix} A& 0\\ 0& B\\ \end{vmatrix}_{n+s}\\

同時,為了能讓它們相互作用,我們希望能在中間加個介質,以達到運算的目的。考慮到介質最好儘可能簡單,最好選擇單位矩陣

I

。同時為了保證運算過程中不出現bug,

I

的秩越大越好,於是選在了左下角。因此,最終用於證明的方陣如下:

\begin{vmatrix} A	& 0\\ I_n& B\\ \end{vmatrix}\\

正式證明:作分塊初等行變換,試圖湊出AB的形式:

\begin{align*} &\begin{vmatrix} A	& 0\\ I_n& B\\ \end{vmatrix}\\ \\ =&\begin{vmatrix} 0	& -AB_s\\ I_n&B\\ \end{vmatrix}\\ \\ =&(-1)^{ns}\begin{vmatrix} -AB_s&	0\\ B		&I_n\\ \end{vmatrix}\\ \\ =&|-AB_s| |I_n| (-1)^{ns}\\ \\ =&(-1)^s (-1)^{ns} |AB_s| |I_n|\\ \\ =&(-1)^{s+ns}|AB| \end{align*}\\

|AB|=(-1)^{s+ns}\begin{vmatrix}A&0\\I_n&B\\\end{vmatrix}\\

接下來我們看看右邊是什麼,先把A顯式寫出來

\begin{vmatrix} a_{11}&a_{12}&\cdots&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&\cdots&a_{2n}\\ \vdots&\vdots&\ddots&\ddots&\vdots&&0&&\\ a_{s1}&a_{s2}&\cdots&\cdots&a_{sn}\\ 		1&		0&\cdots&\cdots&		0\\ 		0&		1&\cdots&\cdots&		0\\ \vdots&\vdots&\ddots&			&\vdots&&B&&\\ \vdots&\vdots&			&\ddots&\vdots\\ 		0&		0&\cdots&\cdots&		1\\ \end{vmatrix}\\

我們觀察公式形式,發現這和拉普拉斯(Laplace)展開很像,考慮按含

A

元素的

前s行

展開。此時列自由選取,但只有選取前n列,產生的子式才不為0,此時得到比內-柯西公式中的第一個子矩陣

A\begin{pmatrix}1,&2,&\cdots&s\\v_1,&v_2,&\cdots&v_s\\\end{pmatrix}\\

我們先不管求和號和排列數的問題,拉普拉斯展開得到

A

的小方陣後,還剩下一個殘缺的n階方陣,這個方陣是由單位矩陣I的部分列與B拼湊而成

\begin{vmatrix} 0&\cdots&0&\cdots&0\\ \vdots&&\vdots&&\vdots\\ 1&\cdots&0&\cdots&0\\ \vdots&&\vdots&&\vdots&&&B&&\\ 0&\cdots&1&\cdots&0\\ \vdots&&\vdots&&\vdots\\ \vdots&&\vdots&&\vdots\\ 0&\cdots&0&\cdots&1\\ \end{vmatrix}\\

顯然,旁邊這堆

(0,0,\cdots,1,\cdots,0)

對我們來說是沒用的,要想方設法扔掉它,使得矩陣更簡潔美觀一些。巧的是這個又是一個方陣,我們又可以再做一次拉普拉斯展開。這次我們按的是

前n-s列

展開,這裡要仔細注意1的具體位置,很巧,因為第一次展開時自由選取的是

1,2,\cdots,s

列,因此殘缺方陣中剩下的應該是單位陣

I

的互補列,總共有n-s列。

而更巧的是,因為這次我們固定的是列,自由活動的是行,而只要選到全為0的殘缺行,其行列式直接就為0,可以不管,於是所有活動行只能全部選含1的,而這樣的情況只有一種(因為只有n-s個1,剛好全選了),所以第二次拉普拉斯展開根本沒有求和號,直接無縫與前面展到的

A

小方陣對接。此時這些1所在位置都是與

1,2,\cdots,s

互補的,記為

\mu_1,\mu_2,\cdots,\mu_{n-s}

比內-柯西(Binet-Cauchy)公式的證明與應用

怕解釋得不詳細,專門做了張圖,思路更清晰

綜上,第二次展開的結果得到了一個單位矩陣

I_{n-s}

以及

B

的小方陣,於是整個矩陣即展開為

 \sum_{1\leq<v_1<\cdots<v_s\leq s} A\begin{pmatrix}1,&2,&\cdots&s\\v_1,&v_2,&\cdots&v_s\\\end{pmatrix} (-1)^{\sum s+\sum v}\cdot B\begin{pmatrix}v_1,&v_2,&\cdots&v_s\\1,&2,&\cdots&s\\\end{pmatrix} |I_{n-s}|(-1)^{\sum n-s+\sum \mu_{n-s}}\\

這裡的

\sum s

表示

1+2+\cdots+s

,下同,這些都是展開過程中產生的逆序數排列,不記得的話可以複習一下拉普拉斯展開:

 |A| = \sum_{1\leq j_1<j_2<\cdots<j_k\leq n} A\begin{pmatrix} i_1,&i_2,&\cdots,&i_k\\ j_1,&j_2,&\cdots,&j_k\\ \end{pmatrix} (-1)^{(i_1+i_2+\cdots+i_k)+(j_1+j_2+\cdots+j_k)} A\begin{Bmatrix} i_1,&i_2,&\cdots,&i_k\\ j_1,&j_2,&\cdots,&j_k\\ \end{Bmatrix}\\

其中圓括號表示保留對應元素形成的子式,花括號表示去除對應元素形成的子式。

繼續上文,我們整理一下上式,得

=\sum_{1\leq<v_1<\cdots<v_s\leq s} A\begin{pmatrix}1,&2,&\cdots&s\\v_1,&v_2,&\cdots&v_s\\\end{pmatrix}\cdot B\begin{pmatrix}v_1,&v_2,&\cdots&v_s\\1,&2,&\cdots&s\\\end{pmatrix}\cdot1\cdot (-1)^{\sum s+\sum v+\sum n-s+\sum \mu_{n-s}}

由於

v

\mu

的選取恰好互補,故

\begin{align*} &\sum s+\sum v+\sum n-s+\sum \mu_{n-s}\\ \\=&\sum s+\sum n-s+\sum v+\sum \mu_{n-s}\\ \\ =&\frac{(1+s)s}{2}+\frac{(1+n-s)(n-s)}{2}+\frac{(1+n)n}{2}\\ \\=&\frac{s^2}{2}+\frac{s}{2}+\frac{n}{2}-\frac{s}{2}+\frac{n^2}{2}-sn+\frac{s^2}{2}+\frac{n}{2}+\frac{n^2}{2}\\ \\ =&s^2+n+n^2-sn\\ \end{align*}\\

(-1)^{s+ns}|AB|=\sum_{1\leq<v_1<\cdots<v_s\leq s} A\begin{pmatrix}1,&2,&\cdots&s\\v_1,&v_2,&\cdots&v_s\\\end{pmatrix}\cdot B\begin{pmatrix}v_1,&v_2,&\cdots&v_s\\1,&2,&\cdots&s\\\end{pmatrix} (-1)^{s^2+n+n^2-sn}\\

(-1)^{s+ns}

移過去

|AB|=\sum_{1\leq<v_1<\cdots<v_s\leq s} A\begin{pmatrix}1,&2,&\cdots&s\\v_1,&v_2,&\cdots&v_s\\\end{pmatrix}\cdot B\begin{pmatrix}v_1,&v_2,&\cdots&v_s\\1,&2,&\cdots&s\\\end{pmatrix} (-1)^{n^2+s^2+n+s}\\

=\sum_{1\leq<v_1<\cdots<v_s\leq s} A\begin{pmatrix}1,&2,&\cdots&s\\v_1,&v_2,&\cdots&v_s\\\end{pmatrix}\cdot B\begin{pmatrix}v_1,&v_2,&\cdots&v_s\\1,&2,&\cdots&s\\\end{pmatrix} (-1)^{n(n+1)+s(s+1)}\\

n(n+1)

s(s+1)

都是偶數,所以直接消去-1,得到

=\sum_{1\leq<v_1<\cdots<v_s\leq s} A\begin{pmatrix}1,&2,&\cdots&s\\v_1,&v_2,&\cdots&v_s\\\end{pmatrix}\cdot B\begin{pmatrix}v_1,&v_2,&\cdots&v_s\\1,&2,&\cdots&s\\\end{pmatrix}\\

終於出來了。

綜上

|AB|= \sum_{1\leq<v_1<\cdots<v_s\leq s} A\begin{pmatrix}1,&2,&\cdots&s\\v_1,&v_2,&\cdots&v_s\\\end{pmatrix}\cdot B\begin{pmatrix}v_1,&v_2,&\cdots&v_s\\1,&2,&\cdots&s\\\end{pmatrix}\\

原式證畢。

3。比內-柯西公式的應用(一)

如果我們對公式取一些特殊情況,Binet-Cauchy公式將會很方便地推出一些我們常見的公式。

柯西恆等式(1)

若取定

A=\begin{pmatrix} a_1&a_2&\cdots&a_n\\ b_1&b_2&\cdots&b_n\\ \end{pmatrix} , B=\begin{pmatrix} c_1&d_1\\ c_2&d_2\\ \vdots&\vdots\\ c_n&d_n\\ \end{pmatrix}\\

此時|AB|可以直接算出來

\Bigg| \begin{pmatrix} a_1&a_2&\cdots&a_n\\ b_1&b_2&\cdots&b_n\\ \end{pmatrix} \begin{pmatrix} c_1&d_1\\ c_2&d_2\\ \vdots&\vdots\\ c_n&d_n\\ \end{pmatrix} \Bigg|\\

=\begin{pmatrix} \sum\limits_{i=1}^{n}a_ic_i&\sum\limits_{i=1}^{n}a_id_i\\ \sum\limits_{i=1}^{n}b_ic_i&\sum\limits_{i=1}^{n}b_id_i\\ \end{pmatrix}\\

=(\sum\limits_{i=1}^{n}a_ic_i)(\sum\limits_{i=1}^{n}b_id_i)-(\sum\limits_{i=1}^{n}a_id_i)(\sum\limits_{i=1}^{n}b_ic_i)\\

也可以用公式展開算

\sum_{1\leq i<j\leq s} \begin{vmatrix} a_i&a_j\\ b_i&b_j\\ \end{vmatrix} \begin{vmatrix} c_i&c_j\\ d_i&d_j\\ \end{vmatrix}\\

=\sum_{1\leq i<j\leq s} (a_ib_j-a_jb_i)(c_id_j-c_jd_i)\\

綜上,

(\sum\limits_{i=1}^{n}a_ic_i)(\sum\limits_{i=1}^{n}b_id_i)-(\sum\limits_{i=1}^{n}a_id_i)(\sum\limits_{i=1}^{n}b_ic_i) = \sum_{1\leq i<j\leq s} (a_ib_j-a_jb_i)(c_id_j-c_jd_i)\\

這個就是著名的

柯西恆等式

,如今用矩陣的方法證出來了。

柯西恆等式(2)

如果我們令

a_i=c_i,b_i=d_i(i=1,2,\cdots,n)

,即

A^T=B

,那麼上式就變成

(\sum_{i=1}^{n}a^2_i)(\sum_{i=1}^{n}b^2_i) - (\sum_{i=1}^{n}a_ib_i)^2 = \sum_{i=1}^{n}(a_ib_j-a_jb_i)^2\\

這個是更常見的版本。

注意觀察式子幾個項的特徵,有什麼特點,接下來會發揮大用處⊙▽⊙。

柯西不等式(1)

注意到柯西恆等式(2)的右邊是個平方和,恆大於0,於是直接有

(\sum_{i=1}^{n}a^2_i)(\sum_{i=1}^{n}b^2_i)-(\sum_{i=1}^{n}a_ib_i)^2\geq0\\

移項,即得柯西不等式:

(\sum_{i=1}^{n}a^2_i)(\sum_{i=1}^{n}b^2_i) \geq (\sum_{i=1}^{n}a_ib_i)^2\\

展開來寫即為:

(a_1^2+a_2^2+\cdots+a_n^2)(b_1^2+b_2^2+\cdots+b_n^2) \geq (a_1b_1+a_2b_2+\cdots+a_nb_n)^2\\

柯西不等式的意義在於將平方的和變為和的平方,相當於把平方“拿出來了”。

柯西不等式

取等條件

當且僅當

(a_1,\cdots,a_n)與(b_1,\cdots,b_n)

線性相關

想想看這是為什麼?

答案:其實也很好想,要取得到0,相當於要行列式

|AA^T|=0

,於是只需

rank(A)<2

,即

(a_1,\cdots,a_n)與(b_1,\cdots,b_n)

線性相關時,不等號取等。

PS:如果對泛函分析,或者說無限維線性空間敏感的人來說,應該能察覺出當上式n趨於

\infty

時,不等式化為連續形式,即積分形式的柯西不等式:

\int_{a}^{b}f(x)^2dx\int_{a}^{b}g(x)^2dx\geq(\int_{a}^{b}f(x)g(x)dx)^2\\

我們常用的是柯西不等式(1)的二階形式:

(a^2+b^2)(c^2+d^2)\geq(ac+bd)^2\\

有時也左右開根號:

\sqrt{a^2+b^2}\sqrt{c^2+d^2}\geq|ac+bd|\\

柯西不等式(2)

這次我們對恆等式的另一個項下手,注意到左邊第二個項

(\sum\limits_{i=1}^{n}a_ib_i)^2

是個和的平方,也是個恆大於等於0的數,扔掉它的話又產生一個新的柯西不等式:

(\sum_{i=1}^{n}a^2_i)(\sum_{i=1}^{n}b^2_i) \geq \sum_{i=1}^{n}(a_ib_j-a_jb_i)^2\\

取等條件

當且僅當

(a_1,\cdots,a_n)與(b_1,\cdots,b_n)

正交

一個的取等條件是平行,另一個是垂直,非常好玩,非常和~諧~

4。比內-柯西公式的應用(二)

Hadamard不等式及其推廣

我們定義對n階矩陣A的劃分為:

A=[ \begin{array}{c;{2pt/2pt}c}B&C\end{array} ]\\

即將n階矩陣A的列向量在某一位置分為兩部分,形成兩個新的矩陣B(n×m)與C(n×n-m)。此時,我們有如下結論:

行列式上界估計

對一切n階矩陣A及其劃分方式,下面不等式均成立:

|A^TA| \leq |B^TB||C^TC|\\

由於A是方陣,於是也可寫成

|A|^2 \leq |B^TB||C^TC|\\

證明:設矩陣B、C的具體形式分別為

B=\begin{pmatrix} b_{11}&b_{12}&\cdots&b_{1m}\\ b_{21}&b_{22}&\cdots&b_{2m}\\ \vdots&\vdots&\ddots&\vdots\\ \vdots&\vdots&\ddots&\vdots\\ b_{n1}&b_{n2}&\cdots&b_{nm}\\ \end{pmatrix} \quad與\quad C=\begin{pmatrix} c_{1,m+1}&\cdots&c_{1n}\\ c_{2,m+1}&\cdots&c_{2n}\\ \vdots&\ddots&\vdots\\ \vdots&\ddots&\vdots\\ c_{n,m+1}&\cdots&c_{nn}\\ \end{pmatrix}\\

於是A的行列式形式為:

A=\begin{vmatrix} b_{11}&b_{12}&\cdots&b_{1m}&c_{1,m+1}&\cdots&c_{1n}\\ b_{21}&b_{22}&\cdots&b_{2m}&c_{2,m+1}&\cdots&c_{2n}\\ \vdots&\vdots&\ddots&\vdots&\vdots&\ddots&\vdots\\ \vdots&\vdots&\ddots&\vdots&\vdots&\ddots&\vdots\\ b_{n1}&b_{n2}&\cdots&b_{nm}&c_{n,m+1}&\cdots&c_{nn}\\ \end{vmatrix}\\

做好定義後,我們來算一下不等式右邊是什麼。對

|B^TB|

,由比內-柯西展開,有:

\begin{array}.  |B^TB| &= \sum\limits_{1\leq i_1<\cdots<i_m\leq n} B^T\begin{pmatrix} 	1,&	2,&\cdots,&m\\ i_1,&i_2,&\cdots,&i_m\\ \end{pmatrix} B\begin{pmatrix} i_1,&i_2,&\cdots,&i_m\\ 	1,&	2,&\cdots,&m\\ \end{pmatrix}\\ \\ &= \sum\limits_{1\leq i_1<\cdots<i_m\leq n} B^2\begin{pmatrix} i_1,&i_2,&\cdots,&i_m\\ 	1,&	2,&\cdots,&m\\ \end{pmatrix}\\ \end{array}

同理對

|C^TC|

亦有

|C^TC| = \sum_{1\leq v_1<\cdots<v_{n-m}\leq n} C^2\begin{pmatrix} v_1,&v_2,&\cdots,&v_{n-m}\\ 	1,&	2,&\cdots,&n-m\\ \end{pmatrix}\\

於是

|B^TB| |C^TC| = \left[  \sum_{1\leq i_1<\cdots<i_m\leq n} B^2\begin{pmatrix} i_1,&i_2,&\cdots,&i_m\\ 	1,&	2,&\cdots,&m\\ \end{pmatrix} \right] \left[  \sum_{1\leq v_1<\cdots<v_{n-m}\leq n} C^2\begin{pmatrix} v_1,&v_2,&\cdots,&v_{n-m}\\ 	1,&	2,&\cdots,&n-m\\ \end{pmatrix}\right]\\

我們給B、C改個字母,改回到原來的A,用矩陣A表示

|B^TB| |C^TC|= \left[  \sum_{1\leq i_1<\cdots<i_m\leq n} A^2\begin{pmatrix} i_1,&i_2,&\cdots,&i_m\\ 	1,&	2,&\cdots,&m\\ \end{pmatrix} \right] \left[  \sum_{1\leq i_1<\cdots<i_{m}\leq m} A^2 \begin{Bmatrix} i_1,&i_2,&\cdots,&i_m\\ 	1,&	2,&\cdots,&m\\ \end{Bmatrix}\right]\\

*(注意後面那個A的括號形狀發生了改變,表示“去除”這些元素)

考慮將平方扔外邊。由Cauchy-Bunyakovsky公式(就是上面的柯西不等式(1)),得:

\geq\left[  \sum_{1\leq i_1<\cdots<i_m\leq n} A\begin{pmatrix} i_1,&i_2,&\cdots,&i_m\\ 1,&	2,&\cdots,&m\\ \end{pmatrix} A\begin{Bmatrix} i_1,&i_2,&\cdots,&i_m\\ 1,&	2,&\cdots,&m\\ \end{Bmatrix}\right]^2\\

(這也是為什麼改矩陣符號和括號的原因,這樣連加號和名字都變得一樣了,兩種子矩陣的編號可以一一對應)

然後把正負號也添上,繼續放

\geq\left[  \sum_{1\leq i_1<\cdots<i_m\leq n}(-1)^{\sum m+\sum i} A\begin{pmatrix} i_1,&i_2,&\cdots,&i_m\\ 1,&	2,&\cdots,&m\\ \end{pmatrix} A\begin{Bmatrix} i_1,&i_2,&\cdots,&i_m\\ 1,&	2,&\cdots,&m\\ \end{Bmatrix}\right]^2\\

由拉普拉斯展開,可知上面這塊東西就是

= |A^2|\\

|B^TB| |C^TC|\geq|A^2|\\

|A^TA|\leq|B^TB| |C^TC|\\

原式證畢。

上式表明,我們可以透過行列式的兩個子部分,來估計這個行列式的大小。因為

B^TB,C^TC

均為正定對稱陣,於是它們的行列式均大於等於0,可以放心地左右開根號,得到

|A|\leq\sqrt{|B^TB| |C^TC|}\\

B^TB,C^TC

形式都比較好時,這不失為一種較好的估計方法。

上式取等條件當且僅當B、C所形成的子空間互為正交補(證明略),這條公式對分割行矩陣也成立,只要轉置一下證明就行了。

哈達瑪(Hadamard)不等式

如果連續使用上一條公式,就會有

\begin{align*} |A^TA|&\leq|\alpha_1^T\alpha_1| |\alpha_2^T\alpha_2|\cdot|\alpha_n^T\alpha_n|\\\\ |A|^2  &\leq\left(\sum_{i=1}^{n}a_{i1}^2\right)\cdots\left(\sum_{i=1}^{n}a_{in}^2\right)\\\\ |A|^2  &\leq\prod_{j=1}^{n}\left(\sum_{i=1}^{n}a_{ij}^2\right)\\ \end{align*}\\

寫開來即為

|A^2| \leq(a_{11}^2+a_{21}^2+\cdots+a_{n1}^2)(a_{12}^2+a_{22}^2+\cdots+a_{n2}^2)\cdots(a_{1n}^2+a_{2n}^2+\cdots+a_{nn}^2)\\

若換成分割行矩陣,即為

|A^TA|\leq|\beta_1^T\beta_1| |\beta_2^T\beta_2|\cdot|\beta_n^T\beta_n|\\

|A^2|\leq(a_{11}^2+a_{12}^2+\cdots+a_{1n}^2)(a_{21}^2+a_{22}^2+\cdots+a_{2n}^2)\cdots(a_{n1}^2+a_{n2}^2+\cdots+a_{nn}^2)\\\

這條公式在各數學分析、高等代數書上很常見。等號成立當且僅當每次分割等號同時成立,體現的效果即為A的各列(行)向量均相互正交,相當於是一個非么正交矩陣。

好啦,這次的總結就到這裡,如果有什麼可以改進的地方歡迎提出,我們下次見!⊙▽⊙