測度論觀點下的初等機率論與隨機過程

本篇標題是向F·克萊因的《高觀點下的初等數學》致敬，就是題圖那本書。F·克萊因是德國大數學家，提出過埃爾蘭根綱領，還有克萊因瓶。Mathematics Genealogy Project主頁上那張學術家譜樹上就有他。他的兩個導師可以分別追溯到高斯和尤拉，希爾伯特是他的徒孫，往下數七代可以找到隨機過程隨機過的cdy老師。整個網站大概記錄了二十萬人，其中有四分之一都是他的學術後代。

扯淡結束。初等機率論裡，我們學了隨機變數。對於離散型隨機變數，就是一個有限或者無限的數列（元素互不相等），每個元素有一個0到1之間的機率，整體的機率和為1。對於連續型隨機變數，有一個機率分佈函式（cumulative distribution function， CDF）

$F(x)=\mathbb{P}(X\le x)$

，其導數是機率密度函式（probability density function， PDF）

，滿足

$\mathbb{P}([x,y])=F(y)-F(x)=\int_x^y f(z)dz$

。

從測度論的角度來講，一個隨機變數

，就是測度空間（measure space）

$(\Omega,\mathcal{F},\mathbb{Q})$

到作為可測空間（measurable space）的實數集（裝備Borel集作為可測結構）

$(\mathbb{R},\mathcal{B})$

的可測對映（measurable mapping）。

這一可測對映誘導了實數集上的機率測度

$\mathbb{P}$

，對於任意Borel集

$S\in\mathcal{B}$

，有

$\mathbb{P}(S)=\mathbb{Q}(\{\omega\in\Omega|X(\omega)\in S\})=\mathbb{Q}(X^{-1}(S))$

。

之後，我們在考慮這個隨機變數的時候，就可以只考慮其在

$\mathbb{R}$

上誘導的機率測度，而不必考慮原先的三元集

$(\Omega,\mathcal{F},\mathbb{Q})$

了。或者說，我們利用對映

$X: (\Omega,\mathcal{F},\mathbb{Q})\to (\mathbb{R},\mathcal{B},\mathbb{P})$

這一『同構』，以

$(\mathbb{R},\mathcal{B},\mathbb{P})$

代替了

$(\Omega,\mathcal{F},\mathbb{Q})$

。

這就是所謂看山三境界：一開始看山是山，只能看到隨機變數是個隨機的實數。然後看山不是山，能看到隨機變數背後是個測度空間，隨機變數本身是個可測對映。最後看山還是山，能看到隨機變數本質上是

$(\mathbb{R},\mathcal{B})$

上的一個機率測度，又回到了實數集。

當然，對於離散型隨機變數，上面的鬼畫符沒什麼意義。引入測度論主要是為了處理不可數集。

下面考慮離散時間有限狀態馬氏鏈，狀態集是

$\mathcal{S}=\{1,2,\cdots,n\}$

。

在初等隨機過程裡，馬氏鏈無非是有個狀態空間，每一步的轉移機率由當前機率唯一決定，所以轉移機率可以寫成一個

$n\times n$

的轉移機率矩陣

$\{p_{ij}\}$

。執行起來，就是看當前狀態是什麼，然後按轉移機率矩陣對應的那一行決定下一步去哪。

對於隨機變數，我們觀測到的是一個實數。對於馬氏鏈，我們觀測到的是一條軌道

$(\cdots,X(-1)=i,X(0)=j,X(1)=k,\cdots)$

。所以整個觀測空間是

$\mathcal{S}^{\mathbb{Z}}$

。注意這是個不可數集合。上面的可測結構

$\mathcal{G}$

由有限柱集（形如

）張成。

於是馬氏鏈又變成了一個可測對映

$X: (\Omega,\mathcal{F},\mathbb{Q})\to (\mathcal{S}^\mathbb{Z},\mathcal{G})$

，同時在右邊誘導了一個機率分佈

$\mathbb{P}$

，對於一個有限柱集，其機率由轉移機率矩陣決定。當然了，這次這個對映沒什麼卵用，因為實際上，我們對左邊沒什麼認識，還是直接看右邊的機率分佈比較實在。

右邊

$(\mathcal{S}^\mathbb{Z},\mathcal{G},\mathbb{P})$

，第一項是軌道空間，第二項是有限柱集生成的

$\sigma$

域。因為我們能在有限柱集上定義機率（依靠轉移機率矩陣），利用Kolmogorov擴張定理，可以定義出一致的機率分佈。實踐中，測度論觀點下的馬氏鏈就是這個三元集，即軌道空間及其機率測度結構。

我們上面實際證明了存在一個隨機過程（軌道空間三元集），其有限柱集的機率與轉移機率矩陣定義的機率相一致。所以馬氏鏈存在。在嚴格的隨機過程理論裡，滿足某些條件的隨機過程的存在性是需要證明的。隨機過程因為軌道空間不可數，自然要用到測度論。

對於連續時間的隨機過程，存在性相對比較難證，因為此時軌道空間是

$\mathcal{S}^{\mathbb{R}}$

，如何定義可測結構，以及如何將機率擴充套件到整個空間上，都比較麻煩。尤其布朗運動還是連續狀態，存在性可是要證一陣子。

我上大學的時候，大二下先學了半學期初等機率論，然後開始看Durrett，懂了些粗淺的測度論和高等機率論。之後的暑假看了Halmos的測度論，大三開學之後學的實變函式論和初等隨機過程。學的時候真是極其酸爽，領悟到上面這些道理的時候，也非常開心。不過這都是後來被純機率虐哭之前的事了。

最後說個小笑話。之前我老闆向一個教授介紹我的時候，說I have a quite capable student。。。這當然是句很好的話。不過也許你可能更熟悉incapable，作為殘疾的一種比較委婉的說法。所以如果從incapable的反義詞來翻譯上面那句話，那就是『我有個學生，嗯，怎麼說呢，好歹不是個殘廢啊！』這意思一下就233333了。

測度論觀點下的初等機率論與隨機過程

AI檔案如何壓縮到最小

NBA彈跳高度前十名的是？

隨便看看

羅丹名字來歷？

犬瘟熱痊癒最初的症狀是什麼樣的？

語文現行教材什麼版本？

大資料的特點主要有什麼？

測度論觀點下的初等機率論與隨機過程

AI檔案如何壓縮到最小

NBA彈跳高度前十名的是？

猜你喜歡

方差什麼時候不變？

做一個線上的趣味測試，小組內部用，最好是免費的？

隨機變數x的機率分佈函式為f服從什麼分佈

隨便看看

羅丹名字來歷？

犬瘟熱痊癒最初的症狀是什麼樣的？

語文現行教材什麼版本？

大資料的特點主要有什麼？