原創文章,如需轉載請聯絡作者!

前文《

Logistic迴歸的起源(上)

》中說到,

維爾赫斯特

在19世紀三、四十年代研究人口數量的增長情況時提出了 Logistic 函式,但是在此後的70幾年裡,Logistic 函式基本上都是處於無人問津的狀態。

直到1920年,

雷蒙德·佩爾

羅威爾·裡德

在研究美國人口增長時又重新發現了這種 S-型曲線。

Logistic迴歸的起源(中)

雷蒙德·佩爾(1879-1940)

雷蒙德·佩爾

(Raymond Pearl, 1879-1940),美國生物學家,也是

生物統計學

的主要倡導者。佩爾可謂是英年才俊,16歲便進入達特茅斯學院(常春藤聯盟之一,2019年US NEWS全美大學綜合排行12名)攻讀生物學,20歲進入密西根大學攻讀動物學博士學位。1905年,26歲的佩爾遠赴倫敦,追隨

卡爾·皮爾遜

(Karl Pearson)學習統計學。正是在此期間,佩爾意識到可以借鑑

統計學

的方法解決生物學、動物學和優生學方面的諸多問題;這也極大地激發了佩爾研究

生物統計學

的興趣。

順便說一下

卡爾·皮爾遜

;學過統計學的人應該都知道他的大名。統計分析中經常用到

擬合優度檢驗

(又稱卡方檢驗)就是皮爾遜提出來的;另外,他還完善了高爾頓提出的相關係數,並證明了迴歸中的複相關係數,因此這個相關係數也稱作“皮爾遜相關係數”。看一下百度百科對皮爾遜的介紹,就能感覺到他滿滿的牛氣!

Logistic迴歸的起源(中)

卡爾·皮爾遜(資料來源:百度百科)

一戰期間(1917 -1919),佩爾是美國食品管理局統計學部的主要負責人;正是這段時期的工作經歷,使得佩爾對

人口增長

糧食需求

問題格外關注。

1920年,

佩爾

裡德

合作,發表了《美國自1790年以來的人口增長率及其數學表示式的研究(On the Rate of Growth of the Population of the United States since 1790 and Its Mathematical Representation)》。該文中,作者發現用一條S-型曲線可以很好地擬合美國1790-1910的人口資料。

Logistic迴歸的起源(中)

佩爾論文中給出的S-型曲線

值得一提的是,佩爾和裡德當時並沒有注意到維爾赫斯特的研究成果,他們對Logistic曲線的發現是獨立的。1922年,佩爾在另一篇文章的腳註中提到了維爾赫斯特,但是他並沒有遵循維爾赫斯特的命名將這條S-型曲線稱之為為Logistic曲線。

直到1925年,英國統計學家

尤爾

(George Udny Yule,1871 – 1951)在當年的皇家統計學會(Royal Statistical Society)的主席致辭中肯定了

維爾赫斯特

的貢獻,並將這種S-型曲線稱之為Logistic曲線——這個名稱一直沿用至今。

Logistic迴歸的起源(中)

尤爾(George Udny Yule,1871 – 1951)

目光再次回到

佩爾

身上。除了在人口增長方面的應用,佩爾和他的同事們還將Logistic曲線應用到了

其它各種生物

的數量增長研究中——從

果蠅

的數量增長,到

北非法屬殖民地的人口增長

等等。佩爾一生著作頗豐,直到去世時,他名下共發表了841篇論文。

1920年,

佩爾

被任命為約翰·霍普金斯大學生物生命統計系(Biometry and Vital Statistics)的主任;而他的助手,也是他的繼任者,正是

裡德

羅威爾·裡德

(Lowell Reed),1886-1966。1907年,21歲的裡德進入緬因大學主修電氣工程;29歲時,裡德獲得賓夕法尼亞大學數學博士學位。裡德在科研方面的成就並沒有佩爾那樣突出,但他是一位非常傑出的教學管理人員——1953年6月,裡德從霍普金斯大學退休;同年9月,他又被邀請回霍普金斯大學並擔任第七任校長。

Logistic迴歸的起源(中)

羅威爾·裡德(1886-1966)

在1920年與佩爾合作發現了Logistic曲線以後,1929年,

裡德

還與

約瑟夫·伯克森

(Joseph Berkson,1899–1982)合作,將Logistic曲線應用到化學領域的自催化反應中——讓我們記住

伯克森

這個名字,因為Logit模型正是伯克森提出來的。

下一篇我們繼續介紹 Probit 模型的誕生,以及 Probit 這個單詞所代表的含義。

未完待續…

往期文章

離散選擇模型基礎/歷史:

離散選擇模型(Discrete Choice Model)簡介

線性模型 vs。 Logistic模型

Logit究竟是個啥?

Odds 和 Odds Ratio 的區別

正確開啟/解讀Logit模型係數的方式

Logit模型擬合實戰案例(SAS)

Logit模型擬合實戰案例(Python)

Logistic迴歸的起源(上)

二項Logit/Probit:

效用最大化準則:離散選擇模型的核心(Probit模型上篇)

效用最大化準則:離散選擇模型的核心(Probit模型下篇)

效用最大化準則:離散選擇模型的核心(二項Logit模型)

從Gumbel分佈到Logistic分佈

多項Logit(MNL):

效用最大化準則:多項Logit模型(Multinomial Logit, MNL)

多項Logit模型(MNL)擬合實戰案例(SAS篇)

MNL的IIA特性與“紅公交/藍公交悖論”(上篇)

MNL的IIA特性與“紅公交/藍公交悖論”(下篇)

如何將決策者的屬性和方案屬性同時放到MNL模型中?

Logit模型中的個人屬性、方案屬性資料處理案例

為什麼條件Logit模型中沒有常數項,以及,你的女神會不會不喜歡你?

Logit模型中的ASC(Alternative-Specific Constant)是指什麼?

統計學相關:

最大似然估計(上)

最大似然估計(下)

模型中存在共線性問題,該怎麼破?

關注微信【DCM筆記】同名公眾號,私信作者獲取相關文章中的 練習資料 和 程式碼:

Logistic迴歸的起源(中)