在瞭解這些概念之前,我想讓大家先清楚
事件
、
基本事件
(
樣本點
)和
樣本空間
的定義。
我們以經典的拋硬幣
試驗
為例,在不拋之前,我們只能確定硬幣落地以後會有兩種結果:正面朝上和反面朝上。拋硬幣
試驗的所有可能結果組成的集合
( {正面朝上,反面朝上},大括號 {} 表示集合符號)我們稱之為
樣本空間
。
事件
是樣本空間的
子集
,它指可能要發生的情況,這些情況包含在樣本空間中。
基本事件
(
樣本點
)指隨機試驗的一個單獨結果。
清楚了上面這些內容。下面的概念會更容易理解。
隨機變數
和普通的變數相比,添加了不確定性,也就是
機率
。還是以拋硬幣舉例,我們知道會有兩種結果(正面朝上、反面朝上),但究竟是哪種結果,我們不知道,只能知道機率值(正面朝上機率為 0。5,反面朝上的機率 0。5,或者其他)。一句話總結,
隨機變數是一個函式,關於試驗結果和與之對應發生機率大小的函式
。
機率分佈
,分佈二字表明機率分佈這個名詞描述的是一種整體情況。的確,機率分佈本身描述的是隨機變數的取值和對應機率大小的
整體概況
。構造這個名詞概念只需要知道隨機變數值和它對應的機率大小,可以將它們彙總成一張表或者其它能夠描述整體概況的形式從而展現整體的分佈情況。
在講解
聯合機率
,
邊緣機率
和
條件機率
之前,我們先看一張某個班級的數學成績統計表:
這張表描述了某個班級中學生在各個分數區間的數學成績分佈情況。從這張表中我們可以得到分數在 [ 90, 100 ] 之間的人數機率為 11/35 ,而女生在 [ 90, 100 ] 之間的機率為 6/35。前者只需要滿足數學成績在 [ 90, 100 ] 之間即可,而後者不僅要滿足這個條件,同時也需要滿足女生這個條件,我們稱前者所求機率為
邊緣機率
,後者所求機率為
聯合機率
。所謂聯合機率,指的是
同時滿足多個條件的機率
,注意條件之間是
平行的關係
(這裡指班級人數的機率分佈情況既可以由成績區間這一隨機變數所囊括,同時也可以由男女性別這一變數所囊括)。邊緣機率是相對於聯合機率而言的,它只考慮聯合機率中的
部分條件
(比如整個班級男生所佔的機率、成績在 90 分以上的學生機率)即可。
條件機率和聯合機率有著相似之處,它們的結果都需要
由多個條件決定
,但條件機率的條件之間並不是平行關係,而是
層層包含
的關係。求聯合機率的時候我們會說“既滿足是女生又滿足成績在 90 分以上的學生機率(這裡相對的是整體學生,機率為 6/35)”,而求條件機率的時候我們會說“滿足成績在 90 分以上的學生在女生中的機率(這裡相對的只有女生這個整體,機率為 6/14)”。簡單概括:聯合機率需要掌控整個公司,而條件機率只需要掌控公司的某個部門即可。