2020北京人工智能壓軸講:圖靈獎得主對AI十年進(jìn)展不買賬?
“您對過去60年,尤其是過去10年的AI進(jìn)展怎么看?”
當(dāng)2003年圖靈獎得主 Alan Kay 被問到這個(gè)問題時(shí),他笑著回答道:“哦,這個(gè)問題很簡單…… AI 這個(gè)詞已經(jīng)被偷走了。當(dāng)年我們稱之為人工智能的研究,現(xiàn)在被改作 ‘通用’人工智能(General AI)。有些人想要取得成功,于是他們決定忽略人工智能研究中較難的問題,也就是關(guān)于認(rèn)知的那部分…… 我承認(rèn)機(jī)器學(xué)習(xí)領(lǐng)域取得了醒目的成就,但我絕不會將其和真正的 AI 混淆,絕無可能?!?/span>
這是 2020 北京智源大會的壓軸演講現(xiàn)場,我和幾千人一起在線觀看了 Alan Kay 和華人計(jì)算機(jī)專家張宏江的對談??瓷先ィ珹lan Kay 似乎對AI過去十年的發(fā)展并不買賬。
在他看來,一個(gè)足夠復(fù)雜的機(jī)器學(xué)習(xí)系統(tǒng),就像是一只“超級鴿子”。這只超級鴿子可以做許多有用的事情。但機(jī)器學(xué)習(xí)領(lǐng)域的研究人員,不能用這個(gè)子領(lǐng)域的進(jìn)展來標(biāo)榜整個(gè)人工智能領(lǐng)域的成功。Alan 指出,如果我們想要發(fā)明能夠和人類自然交互的 AI 系統(tǒng),就必須讓 AI 學(xué)會理解人類的語境和常識。過去四十年中,這個(gè)領(lǐng)域幾乎沒有得到經(jīng)費(fèi)支持。
而現(xiàn)在,Alan 表示,即便我們擁有巨量神經(jīng)元構(gòu)成的神經(jīng)網(wǎng)絡(luò)和專用的芯片,我們做的一切不過是 Judea Pearl 所說的 “曲線擬合”(curve fitting),無論是通過多項(xiàng)式這樣的最簡單的模型來完成,還是通過最復(fù)雜的深度神經(jīng)網(wǎng)絡(luò)模型來達(dá)成,曲線擬合都僅僅是在輸入數(shù)據(jù)和輸出數(shù)據(jù)之間找到某種固定的模式,而非 “理解” 數(shù)據(jù)。Judea Pearl 是貝葉斯網(wǎng)絡(luò)的發(fā)明者,也是2012年圖靈獎的獲得者。他現(xiàn)在致力于讓機(jī)器能夠理解因果關(guān)系,而不僅僅是數(shù)據(jù)之間的相關(guān)性。
“我們不能用 AI 中小小子集的成功,來假裝我們在整個(gè)領(lǐng)域里獲得了激動人心的進(jìn)展。我們需要來真的(get real)…… 如果我有什么話要告訴年輕人,那就是,別去管那些發(fā)論文,拿學(xué)位的廢話…… 真正獲得突破的人,不會在意這些?!?/span>
Alan Kay 的這番話,讓我想到了另一個(gè)著名的“非主流” 研究者和 AI 大潮中的 “異見人士”,印第安納大學(xué)的認(rèn)知科學(xué)教授侯世達(dá)(Douglas Hofstadter)。略懂中文的他為自己取了侯世達(dá)這個(gè)名字。他通常以跨學(xué)科巨著《GEB》聞名于世,但成名并獲得終身教職后,他一直以自己的方式研究人工智能。
在2019年接受果殼網(wǎng)的采訪中,他嚴(yán)厲地批評 AI 領(lǐng)域的機(jī)器學(xué)習(xí)路徑。例如,Google 翻譯團(tuán)隊(duì)宣稱他們的翻譯水平已經(jīng)達(dá)到了人類水平,但仍然會犯低級錯誤,如下圖所示,在明顯的上下文里,將 “shingle” 翻譯為 “帶狀皰疹” 而非 “瓦片”。
直到成稿,Google 也沒有修復(fù)這個(gè)翻譯問題。當(dāng)然,對于黑箱算法來說,修理特定翻譯錯誤是非常困難的。
“1950年代那會兒,說 ‘我們正在研究 AI’ 是沒問題的,我們是在研究它,是在嘗試?yán)斫庵悄?,但現(xiàn)在人們不那么說了,人們說‘這是智能的’,‘那是智能的’。我不喜歡這樣。這是過度簡化扭曲,誤導(dǎo)原意?!?/span>侯世達(dá)在采訪中直言。
不難理解 Alan Kay,Judea Pearl,侯世達(dá)這些前輩,對當(dāng)前 AI 領(lǐng)域繁榮表象的批評。圖靈在那篇啟發(fā)后世的論文中,提出的問題是“機(jī)器能思考嗎?”(Can machine think)?許多老一輩研究者關(guān)心的是從科學(xué)上理解智能,而機(jī)器學(xué)習(xí)并非人類智能的運(yùn)作方式,因?yàn)槿祟愶@然不需要從巨量的數(shù)據(jù)中學(xué)習(xí)如何分辨貓狗。在他們看來,想靠機(jī)器學(xué)習(xí)實(shí)現(xiàn)真正的人工智能,就像那個(gè)古老的寓言,“有人想順著一棵樹往上爬,一直爬到月球”。
而如今,擁有六十年前研究者不敢想象的數(shù)據(jù)量和計(jì)算能力的 AI 研究者,會更加傾向于相信,飛機(jī)為了飛行,并不需要像鳥一樣揮動翅膀。誠然我們能造出厲害的機(jī)器,在圍棋領(lǐng)域戰(zhàn)勝人類世界冠軍。但是,我們還是不理解人類的智能是如何運(yùn)作的。“我們應(yīng)該嚴(yán)肅低對待人工智能中的‘智能’二字(We should take the word 'Intelligence' seriously)?!?/span>Alan Kay 強(qiáng)調(diào)道。
80歲的 Alan Kay 語出驚人的背后,的確有真本事。
他1940年出生于美國麻省,父親是生理學(xué)教授,母親是音樂家。小時(shí)候的Alan是個(gè)神童,三歲就學(xué)會了流利的閱讀,上小學(xué)前,他已經(jīng)讀完了 150 本書。他說,“不知道是幸運(yùn)還是不幸…… 小學(xué)一年級的時(shí)候,我就已經(jīng)知道老師在騙我了?!?/span>
Alan大學(xué)在西弗吉尼亞的 Behany 學(xué)院讀生物學(xué)專業(yè),還輔修了數(shù)學(xué)。他沒畢業(yè)就參加了空軍,并因此接觸到了計(jì)算機(jī),成為一名IBM 1401 程序員。從空軍退役后,Alan 到科羅拉多大學(xué)繼續(xù)讀書,拿到了數(shù)學(xué)和分子生物學(xué)的本科學(xué)位。1966年,進(jìn)入猶他大學(xué)工程學(xué)院讀研究生,研究電氣工程。1970年,Alan 加入了加州的 Xerox PARC(Palo Alto Research Center)。
PARC 是 1970 年施樂(Xerox)發(fā)起的,致力于為 “未來的辦公室” 做長期研究的機(jī)構(gòu)。施樂靠激光打印機(jī)成為全球知名的數(shù)字與信息技術(shù)產(chǎn)品公司,其前身是 ARPA(Advanced Research Projects Agency),互聯(lián)網(wǎng)的原型阿帕網(wǎng)(APRAnet)就是這個(gè)機(jī)構(gòu)在1966年的研究產(chǎn)物。
在PARC, Alan 發(fā)明了圖形用戶界面(GUI)。如果沒有這個(gè)發(fā)明,就不會有后來的 Windows 和 Macintash,我們就不會像現(xiàn)在這樣使用鼠標(biāo)和鍵盤,通過點(diǎn)擊或者觸摸屏幕上的圖形來和電腦交互了。
圖片: Flickr user Nobuyuki Hayashi
不過這還不算什么。在施樂期間,Alan Kay 基于 Smalltalk 語言,提出了面向?qū)ο缶幊?/span>(Object-oriented Programing)的思想。這個(gè)思想幾乎應(yīng)用在一切現(xiàn)代日常計(jì)算機(jī)應(yīng)用軟件的代碼中,也是 C++,Java,Ruby 等現(xiàn)代編程語言的基礎(chǔ)設(shè)計(jì)。此外,他在70年代初,他還提出了 Dynabook 的原型,啟發(fā)了現(xiàn)代筆記本電腦,平板電腦和電子書的設(shè)計(jì)。他關(guān)于 GUI 和 “每個(gè)人都能用電腦” 的思想,深刻影響了比爾蓋茨和喬布斯。
年少功成的 Alan Kay 多才多藝,曾是職業(yè)爵士吉他演奏家和業(yè)余管風(fēng)琴演奏家。顯然,他認(rèn)為自己是名有科學(xué)背景的藝術(shù)家。“藝術(shù)家不會因?yàn)閯e人不接受他的想法就停止創(chuàng)造,他們創(chuàng)造并不是為了售賣,而是為了讓自己的思想得以顯現(xiàn)于世。” 他在分享中說道。
Alan Kay 毫無意外地提到最近40年來計(jì)算機(jī)技術(shù)的 “停滯”。
Alan 曾在17年 FastCompany 的采訪中表示,Tim Berners-Lee 創(chuàng)造的萬維網(wǎng)(World Wide Web,即WWW)和 HTML,與 Douglas Engelbart (超文本鏈接和鼠標(biāo)的發(fā)明人)的思路相比格局太小,只是碰巧被其他同樣頭腦簡單的人接受,變成了標(biāo)準(zhǔn)。而 iPad,也只是他在70年代創(chuàng)造的 Dynabook 和后來的產(chǎn)品 Xerox Palo 的延長線,不幸的是,iPad 更加消費(fèi)主義。
微型計(jì)算機(jī) Xerox Palo,比 Macintosh 早了足足11年,只不過售價(jià)相當(dāng)于現(xiàn)在的 11萬美元。
在他看來,最近20年只有 Croquet 項(xiàng)目值得一提。該項(xiàng)目設(shè)想了一個(gè)所有參與者都可以自由互動的虛擬現(xiàn)實(shí)環(huán)境,像是創(chuàng)造一個(gè)大型多人在線網(wǎng)游,但人們相互交流的是整套的操作系統(tǒng),應(yīng)用軟件和人機(jī)交互方式,這使得參與者可以隨時(shí)改變各種物件的源代碼。Alan Kay 認(rèn)為,“Croquet 的重要性可以和 TCP/IP 相提并論?!?/strong>
Croquet 是 Alan Kay 尚未實(shí)現(xiàn)的一項(xiàng)遠(yuǎn)景(Vision)。他當(dāng)年在 ARPA 工作時(shí)的領(lǐng)導(dǎo),信息處理技術(shù)辦公室的負(fù)責(zé)人 J. C. R Licklider 正是一個(gè)善于描繪遠(yuǎn)景的人。
1960年代,Licklider 看到 “計(jì)算機(jī)命中注定要成為和未來普遍聯(lián)網(wǎng)的人類交互的智能放大器”(Computers are destined to become interactive intellectual ampli?ers for all humans pervasively networked worldwide)。也就是說,他已經(jīng)預(yù)言了個(gè)人計(jì)算機(jī),基于圖形界面的人機(jī)交互技術(shù),以及互聯(lián)網(wǎng)的誕生。更準(zhǔn)確的說,不是預(yù)言,而是 “導(dǎo)演” 了這一切。
在 Alan Kay 看來,杰出領(lǐng)袖的責(zé)任在于提供遠(yuǎn)景,而不是提供目標(biāo)(goal)。只有這樣,才可能取得前所未有的突破。“遠(yuǎn)景給你一種感覺,一種渴望,但沒有任何具體細(xì)節(jié),沒有任何你可以直接上手的問題。你需要自己從遠(yuǎn)景中尋找可以做的事情…… 遠(yuǎn)景就像磁場,研究者能夠感受到這些磁場的存在,感受到北方在哪兒…… 但前往這個(gè)方向的途徑可以是多種多樣的?!?/strong>
這些遠(yuǎn)景,Alan Kay 說,讓當(dāng)時(shí)的年輕人間獲得了一種 “美學(xué)意義的聯(lián)接”?!拔覀儛?Licklider 的遠(yuǎn)景,就像愛一個(gè)情人...我們受到這遠(yuǎn)景的召喚,就像一些人被宗教召喚。”
從 ARPA 到后來的 Xerox PARC,Alan 說,他遇到的領(lǐng)導(dǎo)者沒有官僚,而是科學(xué)家政客(Scientist statesman)。他們盡可能地免除了種種官僚手續(xù)和文書工作,更多地憑借信任工作,放手讓年輕人去嘗試。他們甚至取消了同行審議(peer review)。在他看來,最頂級的工作,是無法找到同行的。
確實(shí),兩個(gè)機(jī)構(gòu)的幾乎每項(xiàng)工作,都開創(chuàng)了一個(gè)全新的行業(yè),它們根本就沒有競爭者。在 Xerox PARC,25名研究人員,5年的時(shí)間,每年1500萬美元的投資,便帶來了 8.5個(gè)重大發(fā)明(那0.5是互聯(lián)網(wǎng)),科研投資帶來的回報(bào),現(xiàn)在已經(jīng)超過了40萬億美元。
Xerox PARC 的8.5個(gè)研究成果
以阿帕網(wǎng)項(xiàng)目的誕生為例,Alan回憶到,人類的互聯(lián)網(wǎng)時(shí)代始于一個(gè)15分鐘的談話。1960年代初的一年,Robert Taylor 和當(dāng)時(shí) ARPA 的負(fù)責(zé)人 Charles Herzfeld 進(jìn)行了一場談話,在15分鐘的時(shí)間里,Robert 估算出約合現(xiàn)在 700萬美元的啟動資金,Charles 稍加詢問后同意了。幾乎在同一天,ARPAnet 項(xiàng)目開始運(yùn)轉(zhuǎn),而項(xiàng)目申請的文書工作直到一年后才補(bǔ)完。
這種程度的信任和效率,無疑會讓現(xiàn)在深陷經(jīng)費(fèi)申請泥潭的項(xiàng)目帶頭人心生羨慕。Alan Kay 認(rèn)為,為了取得開創(chuàng)性的研究進(jìn)展,就必須要有 “瘋錢”(mad money),不在乎后果和回報(bào),投資可以沒有任何明確的目標(biāo)收益。換言之,這些投資是 “非理性” 的。但為了創(chuàng)造,非理性是必要的。
在Alan Kay 看來,Mad money 需要占到某個(gè)機(jī)構(gòu) R&D 經(jīng)費(fèi)的 1%~5%。如果我們認(rèn)為 Xerox PARC 的經(jīng)費(fèi)—— 每年約合現(xiàn)在的1500萬美元—— 全都是 “瘋錢”,那么財(cái)富 Top 418 的公司,都能供養(yǎng)得起自己的 Xerox PARC。而像中國和美國這樣的大國,各自至少可以擁有超過330個(gè) Xerox PARC。
也就是說,我們的科技進(jìn)步速度遠(yuǎn)遠(yuǎn)沒有達(dá)到應(yīng)有的水平。Alan Kay指出,人類應(yīng)該有足夠的能力,去解決那些更大的挑戰(zhàn),例如全球變暖。
全球變暖才是 Alan Kay 現(xiàn)在最關(guān)注的問題。比起過去的科學(xué)家和工程師身份,Alan Kay 現(xiàn)在更像一個(gè)思想家。他關(guān)心的是如何用科技來應(yīng)對人類面臨的重大挑戰(zhàn),例如全球變暖帶來的氣候?yàn)?zāi)難。
“我們可以想象一個(gè)今年出生的孩子,在22世紀(jì)來到的時(shí)候剛好80歲。我們應(yīng)該思考,如何讓他度過這一生?如何讓他在80歲的時(shí)候的地球看上去比現(xiàn)在更好,而不是更糟?” Alan問道。
的確,氣候變暖問題是一個(gè)遠(yuǎn)比新冠疫情危害更大的挑戰(zhàn)。地球上的大氣二氧化碳含量,一直在 200ppm~300ppm 之間震蕩。但自從1950年代以來,這個(gè)數(shù)字已經(jīng)上升了33%,達(dá)到了414ppm。溫室氣體增多會讓地球氣溫升高,而這對環(huán)境的許多影響將是不可逆的。例如,我們的地球科學(xué)知識已經(jīng)揭示,一旦格陵蘭的冰帽融化到一定程度,由于白色冰帽減少導(dǎo)致反射的陽光減少,當(dāng)?shù)貧鉁貙⑦M(jìn)一步升高,而進(jìn)入融冰的正反饋循環(huán)中。末了,地球的海平面將上升7米。
“我們不能用創(chuàng)造問題時(shí)的思維水平來解決問題。” Alan Kay引用愛因斯坦這句話,以解釋解決問題和產(chǎn)生問題并不是對稱的。他指出,打破一個(gè)系統(tǒng)的穩(wěn)態(tài)是很容易的,但要恢復(fù)穩(wěn)態(tài)就很難了。例如,推倒一個(gè)豎立的玻璃瓶,要比扶起一個(gè)平放的玻璃瓶需要的能量少得多。同樣,修復(fù)地球的生態(tài),也遠(yuǎn)比破壞生態(tài)系統(tǒng)要困難得多。
作者簡介