本篇標題是向F·克萊因的《高觀點下的初等數學》致敬,就是題圖那本書。F·克萊因是德國大數學家,提出過埃爾蘭根綱領,還有克萊因瓶。Mathematics Genealogy Project主頁上那張學術家譜樹上就有他。他的兩個導師可以分別追溯到高斯和尤拉,希爾伯特是他的徒孫,往下數七代可以找到隨機過程隨機過的cdy老師。整個網站大概記錄了二十萬人,其中有四分之一都是他的學術後代。
扯淡結束。初等機率論裡,我們學了隨機變數。對於離散型隨機變數,就是一個有限或者無限的數列(元素互不相等),每個元素有一個0到1之間的機率,整體的機率和為1。 對於連續型隨機變數,有一個機率分佈函式(cumulative distribution function, CDF)
,其導數是機率密度函式(probability density function, PDF)
, 滿足
。
從測度論的角度來講,一個隨機變數
,就是測度空間(measure space)
到作為可測空間(measurable space)的實數集(裝備Borel集作為可測結構)
的可測對映(measurable mapping)。
這一可測對映誘導了實數集上的機率測度
,對於任意Borel集
,有
。
之後,我們在考慮這個隨機變數的時候,就可以只考慮其在
上誘導的機率測度,而不必考慮原先的三元集
了。或者說,我們利用對映
這一『同構』,以
代替了
。
這就是所謂看山三境界:一開始看山是山,只能看到隨機變數是個隨機的實數。然後看山不是山,能看到隨機變數背後是個測度空間,隨機變數本身是個可測對映。最後看山還是山,能看到隨機變數本質上是
上的一個機率測度,又回到了實數集。
當然,對於離散型隨機變數,上面的鬼畫符沒什麼意義。引入測度論主要是為了處理不可數集。
下面考慮離散時間有限狀態馬氏鏈,狀態集是
。
在初等隨機過程裡,馬氏鏈無非是有個狀態空間,每一步的轉移機率由當前機率唯一決定,所以轉移機率可以寫成一個
的轉移機率矩陣
。 執行起來,就是看當前狀態是什麼,然後按轉移機率矩陣對應的那一行決定下一步去哪。
對於隨機變數,我們觀測到的是一個實數。對於馬氏鏈,我們觀測到的是一條軌道
。 所以整個觀測空間是
。 注意這是個不可數集合。上面的可測結構
由有限柱集(形如
)張成。
於是馬氏鏈又變成了一個可測對映
,同時在右邊誘導了一個機率分佈
,對於一個有限柱集,其機率由轉移機率矩陣決定。當然了,這次這個對映沒什麼卵用,因為實際上,我們對左邊沒什麼認識,還是直接看右邊的機率分佈比較實在。
右邊
,第一項是軌道空間,第二項是有限柱集生成的
域。因為我們能在有限柱集上定義機率(依靠轉移機率矩陣),利用Kolmogorov擴張定理,可以定義出一致的機率分佈。實踐中,測度論觀點下的馬氏鏈就是這個三元集,即軌道空間及其機率測度結構。
我們上面實際證明了存在一個隨機過程(軌道空間三元集),其有限柱集的機率與轉移機率矩陣定義的機率相一致。所以馬氏鏈存在。在嚴格的隨機過程理論裡,滿足某些條件的隨機過程的存在性是需要證明的。隨機過程因為軌道空間不可數,自然要用到測度論。
對於連續時間的隨機過程,存在性相對比較難證,因為此時軌道空間是
, 如何定義可測結構,以及如何將機率擴充套件到整個空間上,都比較麻煩。尤其布朗運動還是連續狀態,存在性可是要證一陣子。
我上大學的時候,大二下先學了半學期初等機率論,然後開始看Durrett,懂了些粗淺的測度論和高等機率論。之後的暑假看了Halmos的測度論,大三開學之後學的實變函式論和初等隨機過程。學的時候真是極其酸爽,領悟到上面這些道理的時候,也非常開心。不過這都是後來被純機率虐哭之前的事了。
最後說個小笑話。之前我老闆向一個教授介紹我的時候,說I have a quite capable student。。。 這當然是句很好的話。不過也許你可能更熟悉incapable,作為殘疾的一種比較委婉的說法。所以如果從incapable的反義詞來翻譯上面那句話,那就是『我有個學生,嗯,怎麼說呢,好歹不是個殘廢啊!』這意思一下就233333了。