(《文匯報 科技文摘》約稿,原文連結:文匯報-人與機器必將走向合作融合)

關於AlphaGo

AlphaGo厲害的地方在於結合了工程和科研兩方面的工作,透過大量計算資源和工程最佳化將一個方向推向了極致,並且同時借鑑了十年來大家在圍棋上及在計算機視覺上的點滴進展,圍棋和強化學習方向上像蒙特卡羅樹搜尋,自對弈(俗稱“左右互搏”),隨機走子盤面估值,用人工特徵加淺層網路進行快速走子,權衡廣度和深度搜索,權衡從頭探索和先驗知識,計算機視覺方向上像

卷積神經網路

(CNN),殘差網路(ResNet),旋轉翻折樣本增強,等等。這些都不是DeepMind團隊率先想出來的,而是過去的經驗一點點積累起來得到的。只是過去的點滴進步並沒有進入公眾的視野,而AlphaGo達成了這最後的一步。

這個成功有幾個先決條件,其一是模型和問題相互匹配。對AlphaGo來說, 模型和問題的匹配度非常重要。卷積神經網路和圍棋非常匹配,所以僅用四百九十萬樣本就可以學到超過人類的能力。這種匹配性是人透過各種直覺和實驗去找的,而機器的作用在於可以很快實現人的想法,很快試錯。若是模型和問題不匹配,那樣本再多,用處也不是很大,因為

機器學習

中“維數災難”的問題,要憑暴力填滿高維空間,實在不是目前任何數目的計算資源所能搞定的。卷積神經網路(CNN)能和圍棋如此投緣,還是因為圍棋本身的規則比較純粹,存有某種內在美,而CNN很適應這種美,一旦適應性起來了,計算機所具備的高速計算能力就可以全面發動,即便從零開始,完全不透過人類棋譜左右互搏也可以成功。在路線對了之後,計算機所具備的穩定性,精確性,和超過人類幾十億倍的計算速度疊加起來,就使得AlphaGo能在三天內遠遠超過人類作為一個整體三千年來走過的路程。

第二個先決條件是要身處一個完全資訊透明的理想世界,並且在做了決策之後,對這個世界的規則、變化和發展有絕對正確的認知。圍棋每下一子,大家都會非常清楚地知道局面會變成什麼樣子,輸贏也是非常清楚明白的。AlphaGo Zero雖然沒有使用人類棋譜,但它已經從人類這裡得到了圍棋世界的規則,對於過去七步之內雙方下了哪些招法也是完全知曉的(

歷史記錄

是附在特徵輸入之中的,見論文附錄),這些就讓它對局面的推演變得非常容易,在先天上就比人類強過太多。從零開始到超越人類,這個確實是非常厲害的,但僅僅在圍棋世界這個規則分明的地方可以做到。

第三個條件就是要有大量的計算資源。發表於《自然》雜誌的兩篇AlphaGo的文章,都無一例外地強調了對戰時所用的資源數,而有意無意地隱去了訓練時所用的資源數。後者從文章(及自己做些實驗)可以推算,大約在上萬臺甚至更多 。這還僅僅只是復現結果需要的資源數目。而作為開拓者,能成功的路線百中無一,那綜合各種探索試錯的耗費,最後使用的資源更加是個天文數字了。沒有這樣程度的資源,無法完成這樣的工作。

AlphaGo滿足這三個條件,其它問題就沒有那麼容易了。智慧對話系統是個很典型的例子,有基本語法規則但又有大量打破這個規則的例外,有此時此境下的約定慣例,又有與時俱進的林林總總的變化。一個能與別人對話的智慧,既要從過去的含糊的互動中深刻了解現在的基本規則,又要時刻更新自己的

知識體系

,能夠抽象計劃出說話的大概方案,還要及時去推測別人的隱藏狀態和世界的發展趨勢。這些問題目前都沒有答案,都是現在人工智慧的難點。

所以說AlphaGo在業內的影響力並不像在大眾中(尤其是國內)那麼大。在人工智慧領域,每個方法都有優缺點和侷限性,沒有一種方法是萬能的。讓在AlphaGo上做出驚人結果的卷積神經網路,早先在計算機視覺上已獲得巨大的成功,但讓它去擬合含有大量離散特徵的廣告資料,大家都知道效果不佳;同樣左右互搏對其它遊戲也有相當不錯的效果,但讓它去做最佳化機器翻譯,未必有人工標定的資料好。我想主要的問題在於我們之前把圍棋這個千年的文化傳承神化了,所以現在才有這樣大的反彈;若是現在再把AlphaGo神化,那不免又掉進一模一樣的圈子裡去了。

國外對於AlphaGo相比之下要理性很多,在各大論壇上也有更多技術上的深入探討,而不是陷入玄之又玄的空談。等到大家有這個實力AlphaGo拆解得七零八落,對它的每個部分都有比較清晰的瞭解的時候,那我相信它的神秘感,和現在這些疑惑和擔擾,也就煙消雲散。

人工智慧和腦科學

現實的神經元是由

微分方程

描述的連續訊號處理器,有精細的時序結構,有電生理,離子通道和

神經遞質受體

,有能量供應和免疫系統。礙於測量的侷限和

生物系統

的複雜性,我們現在對於大腦的單個神經元還沒有完全瞭解清楚,更不用說大量神經元組合在一起的系統了。

另一方面,現有的

人工智慧演算法

基本上是和腦科學相互獨立的。在各類問題上卓有成效的統計學習方法,比如說線性及非線性擬合方法,最近鄰,決策樹,隨機森林,支援向量機,Boosting等,在大腦結構中鮮有對應。即便在

深度學習

中所謂的神經元,也不過是線性疊加及非線性操作的組合,是現實大腦中神經元的極大簡化,簡化到腦科學家不承認的程度。

這兩門學科之間可以相互啟發,像CNN的思路就和大腦中感受野受限的神經元相似,最近Hinton老前輩試著去用大腦中的柱狀體思路去改進現有

神經網路

的效能,等等;也有學者用統計學習及神經網路的方法對大腦中某些神經元的行為進行建模。但是總的來說,並不存在誰統率誰的問題。

我個人的意見是,不管是腦科學也好,人工智慧也罷,本質上來說還是如何找到一個演算法有效地構建世界模型的問題。大腦經過長久的進化,固然有自然界的鬼斧神工,但也帶著許多因為增量進化而帶來的累贅,不必頂禮膜拜,奉為智慧的唯一模板。人工智慧完全可以在數學原理和大資料的基礎上獨立發展,就像

飛鳥

和飛機的區別一樣,找到自己的規律。

以前教科書上高估了人的能力,把人類特殊化了。其實長遠來看,人沒有那麼特殊,人作為一種智慧體,遵從自己的發展規律,在自然進化的基礎上,一點點認識自身及完成對自身的改造。而我們被進化賜予的那些優點,缺點和弱點,也會縮寫成茫茫歷史中的某一頁,成為將來叱吒星海的地球文明的小小注腳。

人工智慧的現狀

站在業內人士的角度,人工智慧還有很多問題沒有解決,比如說我們可以模糊地說CNN和圍棋很匹配,或者CNN和計算機視覺非常匹配,所以放在一起得到了出乎意料的效果。但究竟什麼才算是匹配?什麼是“匹配”這個詞定量及精確的定義?對於其它問題,什麼是最好的模型,需要用什麼樣的資料?神經網路究竟建模了什麼,和我們的認知有什麼區別?這些本質問題都還沒有答案,而且目前看來,不論是從工具上還是從觀念上看,離摸到答案的邊都還遠得很。

二十世紀初除了上空有兩朵烏雲之外,物理學的大廈基本建成(當然現在可能烏雲更多);與之相比,人工智慧則是鉛雲密佈大雪瀰漫的漫漫極夜,人們才剛剛隱約看到頭頂黑雲縫中那麼一點點的月光。

我們只是摸黑摸久了,不習慣看到光罷了;其實,太陽還遠未升起。

人工智慧的未來

對於大家來說,首先基本肯定的一點是,將來必然是人與機器合作並且逐步融合的世界。在短短十年的時間裡,我們都已經離不開電腦和手機。以古人的標準看,現在的一人加一個手機還算不算人呢?個個博學強記,見多識廣,還精通各國語言,只能說是文曲星下凡了。以後如果能有更強的記憶,更快的推理,更準的預測,看得更遠,聽得更清,大家一定會爭相使用,並在這之上製出更好的造物。試想,如果有一種裝入大腦就可以提高一倍反應速度的

晶片

,那誰會拒絕去使用呢?裝上了之後,還是不是人類了呢?有多少人會去思考這樣的哲學問題?而又有多少人會去反抗這樣的大潮呢?

所以說,與其害怕,不如融入。人工智慧你不做,我不做,總有人做,而做出來之後,就會有極大的競爭優勢。現在基於機器學習的廣告系統已經是這樣了,寫好了程式,躺著可以賺錢,而人要做的是如何改進它,這和傳統行業需要不停維護才能有穩定利潤率相比,已經是高了一個境界了。以後人工智慧做得更好了,可以自動改進演算法,那又是高了一個境界。而且這並非幾百年後才發生的事情,而是在當下就會發生的現實。歷史的列車正在加速前進,以前或許還可以小跑跟隨,以後只能搭車借力。

最後,我不覺得人需要去恐懼害怕機器,因為機器也需要人。現實世界無比複雜,其中暗含著無法準確預測的未來,牽一髮而動全身的複雜聯絡,龐大到不可想象的行動空間,及千億億億種自洽自足的目標和意義。圍棋棋枰上的狀態數已遠遠超過了宇宙中的原子總數,然而它不過是後院的一張茶几,和煦春日下的幾粒石子,還有隨風飄散的一口香茗。

在現實世界這個無限複雜的客觀實在面前,其實機器和人一樣渺小,也必然會攜手同行。