說起線性代數,這是一個讓許多大學生頭皮發麻的科目,原因在于這門科目過于抽象,不好理解,但是認真學習之后會發現線性代數可以很巧妙地用數字描述幾何中的特征與變換,在此我也想通過這篇文章來談一談我認識的線性代數,主要介紹我所了解的幾何意義,
目錄
一、什么是線性
二、矩陣
三、行列式的幾何意義
四、列向量、秩、逆矩陣
五、特征向量與特征值
六、二次型與慣性定理
第一章 什么是線性
首先我打算從何為線性開始談起,線性是指量與量之間按比例成直線關系,換言之,線性更多地在描述討論滿足一個式子的關系

即是線性映射,而對于f(x)=ax+b這樣的式子不符合上述性質,這可以稱為是線性方程,我暫且稱之為仿線性映射(仿射),不難發現,在空間中這實際在說這樣一個道理:如果把坐標系畫成網格狀,那么組成這個坐標系的所有直線滿足兩個條件:1、這些直線在進行變化(即這個映射)的程序中不會出現扭曲,直線任是直線;2、原點還在原來的位置,比如說,上述的f(x)可以看成y軸與x軸之間的映射關系,a是伸縮的倍數,而b是平移的距離,那么原點位置發生改變,顯然不滿足這些規定,在此不做過多討論,


此處值得說明的是可加性和齊次性中的x,y可以代表多東西,數、向量、矩陣等,這也是線性代數主要研究物件,可想而知在之后討論的幾何意義中全都是一次關系,沒有二次關系如x^2,xy之類的式子出現,后面學習的二次型研究的也不是二次關系,而是研究一次線性替換,其實生活中和學術中碰見的問題絕大多數都不是線性的(即非線性),但往往可以從中提取出線性元素進行表達,然后運用編程解區域分問題,對于線性的認知點到為止,不再作更深入討論,
第二章 矩陣
矩陣是線性代數研究的主要主體,定義在此不做說明,它長這個樣子:

現在我們來看看一個矩陣說的是啥,
作為一個優秀的大學生,應該知道向量是啥,空間中的一個有向線段,矩陣就可以看成很多個列向量組成的表A=(a1,a2,a3,……an)而由這些向量任意線性組合而成的空間就是他們張成的空間,運算式為
那么對應于我們熟知的直角坐標系來說,可以把這些線性無關的向量當做一個“奇怪”的基向量,也可以說這樣一個矩陣實際上是對原有的標準基向量做一個相應的變換(旋轉和伸縮),接下來舉一個簡單的例子,拿二維說事吧,先看看下面這個二階單位陣

這個矩陣從向量角度考慮代表什么呢?

它實際代表的是向量(1,0),向量(0,1)張成的空間(這個空間是由這兩個向量任意線性組合得到的)的基向量,換言之,就是這個直角坐標系的兩個基向量,那么在看看下面這個矩陣:

這個矩陣又代表什么呢?讓我們看看這兩個向量張成的空間,這兩個向量的張成空間仍然是這樣一個平面,不難發現主要原因是這個矩陣的秩為2,即兩個向量是具備無關的屬性,但是在這個新的空間中,這個矩陣代表的基向量是(1,0)和(2,1),也就是說這里的y軸仍然是原直角坐標系的y軸,而x軸變換為紅線所在直線,也就是說這個矩陣的幾何意義就是將原x軸旋轉到紅色直線然后拉伸為原來的根號5倍,

說到這里大家可能就會發現了矩陣的幾何意義:對原來的坐標系進行旋轉、拉伸,在這里統稱為“空間變換”,以此類推,對于n階矩陣來說也是這樣一個變換(假設秩為n),即對n維空間進行空間變換,接下來我們看一個例題來檢驗一下你是否學會,
請寫出描述原直角坐標系旋轉一個角度的矩陣(建議自己思考一會),答案如下

設這個旋轉矩陣為A,兩個列向量分別為新基向量i,j,有一個點(x,y),這個點被A作用后變為(X,Y),那么可以寫成(X,Y)=xi+yj,很容易發現(x,y)被這樣一個旋轉矩陣作用后(或者說經過這個空間變換后)
,如果知道矩陣乘法的話這實際就是A(x,y)T=(X,Y)T(T表示轉置),這個例題也更好的讓我們理解了矩陣實際就是一種變換,這個物理意義就是換一個參考系來描述同一個事情,
知道矩陣是變換后,我們可以更進一步理解矩陣乘法了,矩陣乘法實際上是在說幾個變換一起作用,比如說A是伸縮變換,B是旋轉變換,那么AB就是伸縮旋轉變換,也可以說是對B空間里的向量作A的變換,但總體效果還是旋轉伸縮一起體現,這個還比較好理解,接下來我們看看矩陣乘法的一些規則對應的意義,
矩陣乘法為什么要滿足下面這個形式呢? 
AB是將B做出A的變換,即將矩陣B空間里的向量,全部做A變換,最終全部容納到矩陣A的向量空間內,可以重疊,重疊即降維(針對線性空間講,非線性變換能扭曲重疊)其中矩陣的列數代表基向量個數,行數代表的意義是原向量空間的維度數,這段話可能比較難懂,所以我以一個實體來說明,設B是一個3x2的矩陣,行數為三我們認為是個三維向量,列數為二我們認為有兩個這樣的向量,設A是一個2x3的矩陣,列為三說明是一個涉及三個基向量(這里的基向量不考慮是否無關,僅僅表示可以接收的資訊量)的空間變換,行數為二說明這兩個三維向量在變化后需要容納在這個二維空間中,這也就是降維打擊,可以說A這個矩陣的列數代表可以接收的維度個數,至于變化后是幾維度我們不關心,因為可以重疊降維或者說這就像是在投影,而只有B中向量的維數與A的接收維數匹配時,才能用A來作用B或者說才能將B中的向量放入A形成的空間中,這個問題到此論述完畢,過多細節不再探討,

接下來我想用3x2的矩陣乘以2x3的矩陣來對比說明資訊量
如圖,藍色向量分別為(1,0)(-1,2)(2,-1)為矩陣a

的三個基向量,注意到一點,他有三個基向量,但是只有兩個維度,也就是說一個平面就能放下他的向量空間,如圖很明顯,問題在于將兩個維度的矩陣A做矩陣B變換,B有三個維度,這就是之前所說和投影的區別,投影會丟失資訊,往往要用投影還原影像時還需要加入其它資訊,比如另一個方向的投影,但是這個不需要,因為他的資訊是完整的,即矩陣A雖然只有兩個維度,但是包含了三個基向量,這三個基向量可以在三維中展開(這種展開升維只是用更高維的視角去看的時候,他的坐標需要多加一個維度表示,但是實際上并沒有添加資訊,如上圖,原本可以用二維平面表示矩陣A空間,用xy坐標對就能全部表示,經過矩陣B變換,B的基向量用紅色表示,原A基向量變成黑色向量,它雖然在標準直角坐標系中每個點需要xyz三個坐標表示,但實際上其向量空間仍然是一個二維平面,只是在三維空間中被傾斜放置了)
附黑色向量坐標 (有一個和紅色的重疊了)
至于AB是多少不重要,
第三章行列式的幾何意義
先讓我們看一個簡單的例子

看這個2階方陣他的行列式幾何意義如圖
就是這個平行四邊形的面積,

此外我們通過學習高等數學也知道向量混合積就是求三階方陣行列式,這代表著斜六面體的體積,至此我們對行列式的幾何意義有了個大致的了解,
接下來讓我們研究一下行列式具體意義,首先我們要知道行列式到底在描述什么玩意,經過上面矩陣幾何意義論述,我們知道矩陣實際上是一種變換,假設在標準直角坐標系中有一塊面積區域,我們可以準確求出面積大小,然后讓這個坐標系發生旋轉伸縮,很容易知道這個面積區域形狀也會隨之改變,那么面積呢?顯然面積也會隨著改變,OK知道這個以后行列式的意義就能明白了,行列式實際上就是在描述這個面積變化的倍數,比如說這個圖

綠色區域經過矩陣
變化后變成了橙色區域,面積變成了兩倍,變大倍數正是這個行列式的值,如果行列式值為負值,說明坐標系被翻了面,簡單的判斷方式就是變化后的y軸在x軸的右邊(這里的左右按從x軸轉到y軸角度小的那邊),由于坐標網格做了相同變化,所以對于網格中任意區域面積變化一樣,對于三階方陣行列式研究方式一樣,這個行列式代表的是立體圖形體積的變化倍數,以此類推n階也是如此,只是我們無法想象,
但有些可愛的同學會發現有時候行列式為0,這是什么意思呢?我們先看看為什么行列式會為0,比如說這個矩陣
很容易知道這個矩陣把x、y軸旋轉到一根直線上了,這說明直角坐標系變成了一根數軸,然后問你區域面積,顯然這區域變成0了,從維度的角度說的話,這個矩陣相當于降維,對于三階也是如此,我們高等數學中學習的混積等于0說明三個向量共面正是這個道理,也就是說立體被壓縮成一個面,體積自然是0,
知道了幾何意義,我們再來看看行列式計算公式怎么來的,

先來看看如果a21,a12等于0,那么就是兩個簡單的向量(a11,0),(0,a22)對應的面積倍數也很容易知道是a11×a22,看看下面這個圖就能知道這個公式怎么的出來的了,

行列式意義介紹到此結束,
第四章 列向量,秩與逆矩陣
秩在多數線代人眼中是指一個矩陣非零子式的最高階數,比如說這個矩陣
這個矩陣的秩為2,因為它的二階行列式不為0,當然這只是秩的一個定義,從這個定義我們看不出幾何意義,接下來讓我們從“矩陣由向量組成”的角度來看看秩的意義,看了上面矩陣這一章,我們知道矩陣可以認為是由很多個列向量組成(行向量一樣,后面只討論列向量),書上說秩也是列向量最大線性無關組中向量的個數,不知道大家對線性無關是否有足夠的理解,在我看來線性無關研究的是這幾個向量張成空間的維數,比如上面這個矩陣張成的空間是二維,秩就是二,再看看下面這個矩陣
,很容易知道它的秩是1,也就是說這兩個向量張成的空間是一條數軸,從行列式等于0的角度也可以理解,就是空間變換使得二維區域壓縮為一維,那么張成的空間維數自然是1,說到這里大家應該對秩有了一個新的認知,這個認知有利于讓我們面對秩的問題時不那么迷茫,比如說下面這個這個例子
R(AB)≤min{R(A),R(B)}
大家跟我一起分析一下這個不等式,R(AB)是A作用于B后的新向量組張成的空間,由上面矩陣乘法的幾何意義可以知道,AB就是把B的向量放入A形成的空間中,那么請問新向量組維數會變高嗎?不但不會,而且維數不會高于A ,B中秩最小的那一個,為什么?為了簡化,舉個例子,AB=
R(A)=2,R(B)=1,R(AB)=1,接下來有點難理解,要認真了哦,B矩陣中兩個向量張成的空間維數是1,也就是說一個維度就可以儲存B中向量的資訊量,注意了這里的資訊量是指描述B中兩個向量自身及其關系的資訊,那么這就和上面說矩陣乘法舉的例子一樣了,把這兩個向量放在被A操作后的這個空間中,會發現B中這兩個向量升維了,但是他們的資訊可以在一個維度描述清楚,換言之他們就在一個數軸上,只是用上帝視角觀看,本質并沒有改變,同樣如果是R(A)<R(B)會出現相反的情況,也就是把一個高維空間壓縮到低維空間,那么有些資訊就被丟掉了,也就是投影會使某些維度資訊丟失,丟失資訊后,描述這些向量也就不需要原來那么多維度了,秩就減小了,那為什么有時候R(AB)<R(A),R(B)呢?比如說運氣比較好的時候,可能出現這種情況,三維向量組壓縮到二維空間的時候一不小心壓縮到了一條線上,結果變成了一根數軸,這不就出現了小于兩者秩的情況了嘛O(∩_∩)O,是不是很有道理,這個不等式討論到這里,總結一下,秩的幾何意義就是說列向量張成的空間的維數,不滿秩說明這些向量組成的空間降維了,或者說這些向量的資訊量可以在一個低維度中描述清楚,
ok,對秩有一定理解后我們再論行列式值為0,行列式值為0說明空間壓縮,維度降低,所以為什么我們可以用行列式是否為0來判斷是否滿秩,因為他們都可以描述空間維度(其中行列式是間接反映),下面由要討論一個難點了,逆矩陣,
我們先看看這個運算式Ax=∧,A是矩陣,∧,x是向量,這個運算式是什么意思呢?意思就是一個向量x經過矩陣A變換后變成另一個向量∧,拓展開來x可以代表很多個向量,∧也可以代表很多個向量,喜歡思考的同學們會問x可以變為∧,那∧在什么情況下可以逆變換為x呢?這就是我們將要討論的逆矩陣,
逆矩陣,顧名思義讓空間變換效果逆過來的矩陣,我們先看看假設A的行列式不為0,似乎總可以找到一個矩陣B,使這個矩陣B與A的效果互逆,(至于這個逆矩陣怎么求,這篇文章就不介紹了,)那如果行列式等于0呢?會出現什么情況?A的行列式為0說明A把空間壓縮到了一個更低的維度,但是我們永遠無法找到一個矩陣可以升高空間的維度,雖然x的資訊量有可能可以完整描述,但是空間無法復原,也就是說效果無法逆轉,從這個知識你是否悟出來一點人生哲理呢?(_)(▽)自己想想吧!非常奇妙,這也就是為什么可逆與否取決于行列式是否為0,
(注初等行變換實際上是把運算式當做方程組來解決,幾何意義沒有太大討論意義,這篇文章中不做討論,)
第五章 特征向量與特征值
我們知道書中說的特征向量和特征值是在這個運算式中定義的,

其中A是矩陣,x是(非零)特征向量,λ是特征值,讓我們看看這個等式在描述什么事情,A代表一種變換,x代表一個向量或一堆向量(在這里簡化為一個),A變換作用于向量x后,x向量的所在直線不變,或者說x沒變只是乘了λ倍,讓我們看看在直角坐標系中的樣子,

黑色坐標線是未經過A矩陣變換的基向量方向,經過A矩陣變換后,基向量方向為藍色的兩條直線方向,x向量一開始為黑色的向量,變化后為紅色向量,這個圖形實際上表達的是面 這個式子,

很容易發現特征值λ就是這個向量變化的倍數,正數同向,負數反向,(對于我們所學的線代知道這些足矣,感興趣的往下看,)
其實特征值特征向量在我們所學的線性代數中體現不明顯,我們僅僅用于做題,什么求特征值呀,求特征向量呀,但是在閱讀文獻的時候我發現了一些有趣的運用,在這里和大家分享一下,不過這個應用我也不太了解,只是簡單的闡述一下,我們先看看生活中的一種現象,如果我們把一塊石頭丟進水中,會產生水波,這并不是水往遠處傳遞,而是某水珠原地上下振動并把能量傳遞給旁邊的水珠,于是能看見波浪往外推移,而且水波的振幅不斷變小直至為0,現在看看特征值體現在哪,在由某塊有著特定質量和形狀的石頭被以某種角度和速度投入某個面積和深度特定的水池中所決定的某個矩陣中,紋波蕩漾中水珠的漸變程序中其特征值起著決定性的作用,它決定著水珠振動的頻率和幅度減弱的衰退率,(不深入研究,我了解的也比較少),
振動有頻譜,矩陣也有矩陣的譜,這譜就是有特征值組成,比如一對士兵通過橋梁的例子,傳統上,他們要停止齊步前進而要散步通過,這個理由是因為他們可能以等于橋的特征值之一的頻率齊步行進,從而將發生共振,就像孩子的秋千那樣,你一旦注意到一個秋千的頻率,和此頻率相配,你就使頻率蕩得更高,一個工程師總是試圖使他的橋梁或他的火箭的自然頻率遠離風的頻率或液體燃料的頻率;而在另一種極端情況,一個證券經紀人則盡畢生精力于努力到達市場的自然頻率線,特征值是幾乎任何一個動力系統的最重要的特征,
矩陣對物理資訊而言有著獨特的性質,如果一個物理性質可以由矩陣描述,那么一個信號(相當于向量)傳入,在經過矩陣變化后會發生伸縮,旋轉等變化,唯獨特征向量才會穩定的伸長或收縮,那么如果我需要一個特征信號,我們就可以讓這樣一個矩陣反復作用這些信號,最終得到的最清楚的信號就是特征信號或說特征向量,(不說了不說了,太費腦子,)
對于PCA(主成成分分析)還有話可說,(?ω?)hiahiahia,首先看看資訊量,看看下面這
三個圖分別把所有資訊投影到x1軸上,圖一投影的離散度較大,圖三次之,圖二最小,或者說圖一投影后資訊的區分度最大,而圖二區分度小,用方差來解釋的話,圖一方差最大,圖二最小,資訊量,離散度,區分度,方差對應關系應該比較容易看出來,我們現在想把這些橢圓上的資訊降維處理,很容易知道我們要保留資訊量較大的那個數軸,圖一保留X1,圖二保留X2,圖三都不太好,但是如果把坐標軸旋轉,

我們就可以用紅色的軸來降維了,其實,經過數學上的推導的,特征值對應的特征向量就是理想中想取得正確的坐標軸,而特征值就等于資料在旋轉之后的坐標上對應維度上的方差,

這個就是特征值和特征向量的一個實際應用——得出使資料在各個維度區分度達到最大的坐標軸,特征向量和特征值就說到這里,
第六章 二次型與慣性定理
終于終于來到了我想講的最后一章內容(′▽`???),這章我們來看看二次型的幾何意義,二次型的定義自己看書,在這篇文章不多提了,在第一章“什么是線性”中我就提到過二次型,我們研究的不是二次型的性質,而是研究線性替換,那么什么是線性替換呢?

看看上面這個式子,這就是線性替換,由前面說的矩陣意義,我們可以知道這實際是用矩陣作用后的的基向量替換原來基向量,換言之就是換個坐標系,接下來我們看看二次型的幾何意義是什么,二次型說白了就是一個方程曲線,讓我們看幾個,

接下來我們結合線性替換看看二次型,二次型所確定的圖形在變換程序中不動,僅僅是改變坐標系,但是在不同基向量表示下會變成不同形狀,比如說橢圓變圓

實際圖形沒變只是換了個角度看它而已,Ok,知道這些后,我們可以知道實際上線性替換想要達到的目的就是在一個特定的坐標系中看清它的真面目,知道這是個什么圖形,我們來看看為什么要用非退化的線性替換,退化也就是不滿秩,也就是說會把空間壓縮降維,那么請問圖形還能保持嗎?顯然不能,從資訊量來說,這樣變化可能有資訊丟失,那么原來樣子就沒有嘍,甚至面目全非,不信的話就看看

你看看,你看看好好的一個橢圓變成了兩條平行線😭😭😭😭,慘兮兮,
這就是我們為什么要用非退化矩陣的原因,我們常見的二次型的矩陣是實對稱矩陣,有很特殊的性質,為什么,你知道嗎?實對稱矩陣有n個線性無關的特征向量,那么我們就可以正交化這些特征向量,

由上面這個推導我們知道用X=PY來替換,P正好是特征向量構成的矩陣,誒你說巧不巧,這些特征向量可以正交化,那么這個變換是什么意思?說明我們變換后采用的坐標系是一個直角坐標系(各個基向量相互垂直),或者說相當于把原直角坐標系旋轉伸縮,那么我們在單位化一下呢,不就只是旋轉了嗎!那么圖形在新坐標系下形狀和原來不就一樣了嗎!這豈不是很好判斷,二次型與線性替換到此結束,
接下來我們看看慣性定理,二次型的標準型可以不唯一,這取決于線性替換,但是規范型唯一,這就是慣性定理的重要意義之處,慣性定理說明了圖形的本質形狀,比如說下面這個二次型,代表者一個橢圓,那么經過一定的線性替換之后,一定可以變為下面這個標準的橢圓(圓是特殊的橢圓,圓可以說是橢圓的規范型),

這就是由正負慣性指數決定的,這個指數決定了規范型的最終形態,也就是圖形的最純樸的模樣,
我眼中的線性代數這篇故事就說到這嘍,線性代數在很多人眼中或許比較枯燥無味,因為全篇下來全是數字,看著頭皮發麻,這篇文章簡單講述了一下線代的幾何意義,希望讀者能夠重建對線性代數的熱情,一起來感受一下一堆數字背后的空間世界吧,下面是作者以及核心支柱者的QQ,歡迎大家和我們一起討論,完結撒花!
作者QQ:1215686324
核心支柱QQ:2868892460
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/278012.html
標籤:AI
