本篇標題是向F·克萊因的《高觀點下的初等數學》致敬,就是題圖那本書。F·克萊因是德國大數學家,提出過埃爾蘭根綱領,還有克萊因瓶。Mathematics Genealogy Project主頁上那張學術家譜樹上就有他。他的兩個導師可以分別追溯到高斯和尤拉,希爾伯特是他的徒孫,往下數七代可以找到隨機過程隨機過的cdy老師。整個網站大概記錄了二十萬人,其中有四分之一都是他的學術後代。

扯淡結束。初等機率論裡,我們學了隨機變數。對於離散型隨機變數,就是一個有限或者無限的數列(元素互不相等),每個元素有一個0到1之間的機率,整體的機率和為1。 對於連續型隨機變數,有一個機率分佈函式(cumulative distribution function, CDF)

F(x)=\mathbb{P}(X\le x)

,其導數是機率密度函式(probability density function, PDF)

f(x)

, 滿足

\mathbb{P}([x,y])=F(y)-F(x)=\int_x^y f(z)dz

從測度論的角度來講,一個隨機變數

X

,就是測度空間(measure space)

(\Omega,\mathcal{F},\mathbb{Q})

到作為可測空間(measurable space)的實數集(裝備Borel集作為可測結構)

(\mathbb{R},\mathcal{B})

的可測對映(measurable mapping)。

這一可測對映誘導了實數集上的機率測度

\mathbb{P}

,對於任意Borel集

S\in\mathcal{B}

,有

\mathbb{P}(S)=\mathbb{Q}(\{\omega\in\Omega|X(\omega)\in S\})=\mathbb{Q}(X^{-1}(S))

之後,我們在考慮這個隨機變數的時候,就可以只考慮其在

\mathbb{R}

上誘導的機率測度,而不必考慮原先的三元集

(\Omega,\mathcal{F},\mathbb{Q})

了。或者說,我們利用對映

X: (\Omega,\mathcal{F},\mathbb{Q})\to (\mathbb{R},\mathcal{B},\mathbb{P})

這一『同構』,以

(\mathbb{R},\mathcal{B},\mathbb{P})

代替了

(\Omega,\mathcal{F},\mathbb{Q})

這就是所謂看山三境界:一開始看山是山,只能看到隨機變數是個隨機的實數。然後看山不是山,能看到隨機變數背後是個測度空間,隨機變數本身是個可測對映。最後看山還是山,能看到隨機變數本質上是

(\mathbb{R},\mathcal{B})

上的一個機率測度,又回到了實數集。

當然,對於離散型隨機變數,上面的鬼畫符沒什麼意義。引入測度論主要是為了處理不可數集。

下面考慮離散時間有限狀態馬氏鏈,狀態集是

\mathcal{S}=\{1,2,\cdots,n\}

在初等隨機過程裡,馬氏鏈無非是有個狀態空間,每一步的轉移機率由當前機率唯一決定,所以轉移機率可以寫成一個

n\times n

的轉移機率矩陣

\{p_{ij}\}

。 執行起來,就是看當前狀態是什麼,然後按轉移機率矩陣對應的那一行決定下一步去哪。

對於隨機變數,我們觀測到的是一個實數。對於馬氏鏈,我們觀測到的是一條軌道

(\cdots,X(-1)=i,X(0)=j,X(1)=k,\cdots)

。 所以整個觀測空間是

\mathcal{S}^{\mathbb{Z}}

。 注意這是個不可數集合。上面的可測結構

\mathcal{G}

由有限柱集(形如

(X(-1)=i,X(0)=j,X(1)=k)

)張成。

於是馬氏鏈又變成了一個可測對映

X: (\Omega,\mathcal{F},\mathbb{Q})\to (\mathcal{S}^\mathbb{Z},\mathcal{G})

,同時在右邊誘導了一個機率分佈

\mathbb{P}

,對於一個有限柱集,其機率由轉移機率矩陣決定。當然了,這次這個對映沒什麼卵用,因為實際上,我們對左邊沒什麼認識,還是直接看右邊的機率分佈比較實在。

右邊

(\mathcal{S}^\mathbb{Z},\mathcal{G},\mathbb{P})

,第一項是軌道空間,第二項是有限柱集生成的

\sigma

域。因為我們能在有限柱集上定義機率(依靠轉移機率矩陣),利用Kolmogorov擴張定理,可以定義出一致的機率分佈。實踐中,測度論觀點下的馬氏鏈就是這個三元集,即軌道空間及其機率測度結構。

我們上面實際證明了存在一個隨機過程(軌道空間三元集),其有限柱集的機率與轉移機率矩陣定義的機率相一致。所以馬氏鏈存在。在嚴格的隨機過程理論裡,滿足某些條件的隨機過程的存在性是需要證明的。隨機過程因為軌道空間不可數,自然要用到測度論。

對於連續時間的隨機過程,存在性相對比較難證,因為此時軌道空間是

\mathcal{S}^{\mathbb{R}}

, 如何定義可測結構,以及如何將機率擴充套件到整個空間上,都比較麻煩。尤其布朗運動還是連續狀態,存在性可是要證一陣子。

我上大學的時候,大二下先學了半學期初等機率論,然後開始看Durrett,懂了些粗淺的測度論和高等機率論。之後的暑假看了Halmos的測度論,大三開學之後學的實變函式論和初等隨機過程。學的時候真是極其酸爽,領悟到上面這些道理的時候,也非常開心。不過這都是後來被純機率虐哭之前的事了。

最後說個小笑話。之前我老闆向一個教授介紹我的時候,說I have a quite capable student。。。 這當然是句很好的話。不過也許你可能更熟悉incapable,作為殘疾的一種比較委婉的說法。所以如果從incapable的反義詞來翻譯上面那句話,那就是『我有個學生,嗯,怎麼說呢,好歹不是個殘廢啊!』這意思一下就233333了。