對(duì)話國(guó)際機(jī)器學(xué)習(xí)協(xié)會(huì)創(chuàng)始主席:人類(lèi)哪些工作不會(huì)被機(jī)器取代?| NSR專(zhuān)欄
?美國(guó)俄勒岡州立大學(xué)計(jì)算機(jī)科學(xué)榮譽(yù)教授托馬斯·迪特里奇(Thomas Dietterich)
撰文 | 周志華(南京大學(xué)教授)
翻譯 | 初 浩
校譯 | 張志鵬
● ● ●
機(jī)器學(xué)習(xí)是人工智能(AI)熱潮的一大驅(qū)動(dòng)力。不久前,美國(guó)俄勒岡州立大學(xué)計(jì)算機(jī)科學(xué)榮譽(yù)教授、人工智能進(jìn)步協(xié)會(huì)(AAAI,人工智能領(lǐng)域最負(fù)盛名的協(xié)會(huì))前主席及國(guó)際機(jī)器學(xué)習(xí)協(xié)會(huì)創(chuàng)始主席托馬斯·迪特里奇(Thomas Dietterich)教授接受《國(guó)家科學(xué)評(píng)論》(NSR)采訪,談到了機(jī)器學(xué)習(xí)的最新進(jìn)展和技術(shù)挑戰(zhàn),以及其對(duì)世界的巨大影響。
機(jī)器學(xué)習(xí)為什么重要
機(jī)器學(xué)習(xí)有什么用?
迪特里奇:機(jī)器學(xué)習(xí)為開(kāi)發(fā)高性能軟件提供了新的方法。在傳統(tǒng)的軟件開(kāi)發(fā)過(guò)程中,我們與用戶交談,規(guī)劃用戶需求,然后根據(jù)需求,設(shè)計(jì)、實(shí)施和測(cè)試滿足這些需求的算法。通過(guò)機(jī)器學(xué)習(xí),我們?nèi)詴?huì)制定軟件系統(tǒng)的整體目標(biāo),但我們自己并不設(shè)計(jì)算法,而是收集訓(xùn)練案例(通常是通過(guò)人工標(biāo)注數(shù)據(jù)點(diǎn)),然后應(yīng)用機(jī)器學(xué)習(xí)算法來(lái)自動(dòng)學(xué)習(xí)所需的功能。
這些由新方法開(kāi)發(fā)出的軟件,可以為我們解決傳統(tǒng)軟件工程方法所解決不了的許多問(wèn)題。具體來(lái)說(shuō),從前的視覺(jué)對(duì)象檢測(cè)和識(shí)別、語(yǔ)音識(shí)別和語(yǔ)言翻譯方法的性能達(dá)不到可用水平。但是隨著機(jī)器學(xué)習(xí)最近的進(jìn)步,我們現(xiàn)在擁有了可以執(zhí)行這些任務(wù)的系統(tǒng),其準(zhǔn)確性(或多或少)可與人類(lèi)的表現(xiàn)相媲美。
因此,機(jī)器學(xué)習(xí)這一關(guān)鍵技術(shù)使許多應(yīng)用成為現(xiàn)實(shí),比如自動(dòng)駕駛汽車(chē)、實(shí)時(shí)駕駛指引、跨語(yǔ)言用戶界面及支持語(yǔ)音的用戶界面等。機(jī)器學(xué)習(xí)對(duì)于網(wǎng)頁(yè)搜索引擎、推薦系統(tǒng)和個(gè)性化廣告也很有價(jià)值。許多人預(yù)測(cè)機(jī)器學(xué)習(xí)方法將導(dǎo)致一場(chǎng)醫(yī)學(xué)革命,特別是在醫(yī)學(xué)圖像的自動(dòng)收集和分析領(lǐng)域。機(jī)器學(xué)習(xí)在現(xiàn)代公司的運(yùn)營(yíng)方面也是一種前景良好的工具,例如它可以幫助預(yù)測(cè)客戶需求并優(yōu)化供應(yīng)鏈。它也是訓(xùn)練機(jī)器人執(zhí)行靈活制造任務(wù)的關(guān)鍵技術(shù)。
為什么說(shuō)機(jī)器學(xué)習(xí)對(duì)科學(xué)界和社會(huì)都很重要?
迪特里奇:機(jī)器學(xué)習(xí)方法可以幫助收集和分析數(shù)據(jù),例如,機(jī)器學(xué)習(xí)方法和技術(shù)可用于分析大型強(qiáng)子對(duì)撞機(jī)收集的大量數(shù)據(jù),也對(duì)天文數(shù)據(jù)的分析至關(guān)重要。通過(guò)輔助設(shè)計(jì)實(shí)驗(yàn),機(jī)器學(xué)習(xí)技術(shù)可以幫助科學(xué)家決定需要收集哪些數(shù)據(jù),隨后機(jī)器人系統(tǒng)可以在實(shí)驗(yàn)室或現(xiàn)實(shí)世界中自動(dòng)執(zhí)行這些實(shí)驗(yàn),例如由Ross King開(kāi)發(fā)的“自動(dòng)化科學(xué)家”程序可以設(shè)計(jì)、執(zhí)行和分析它自己的實(shí)驗(yàn),遠(yuǎn)洋滑翔機(jī)器人也是由人工智能系統(tǒng)控制的。機(jī)器學(xué)習(xí)技術(shù)也開(kāi)始應(yīng)用于控制那些在生態(tài)系統(tǒng)和城市中收集數(shù)據(jù)的無(wú)人機(jī)。
我個(gè)人的研究重點(diǎn)是應(yīng)用機(jī)器學(xué)習(xí)來(lái)改善我們對(duì)地球生態(tài)系統(tǒng)的管理。例如,在俄勒岡州,經(jīng)常發(fā)生雷電造成的森林火災(zāi)。這些火災(zāi)可以摧毀瀕危物種的棲息地,燒毀本可能用于建造房屋的樹(shù)木。導(dǎo)致這些大火的原因之一,是美國(guó)撲滅了多年來(lái)的每一起火災(zāi)。這一做法非常昂貴,也使得可燃物在森林中累積。所以,當(dāng)發(fā)生新的火災(zāi)時(shí),燃燒會(huì)十分劇烈且更具破壞性。我們正在應(yīng)用機(jī)器學(xué)習(xí)(強(qiáng)化學(xué)習(xí))方法來(lái)找出決定哪些火災(zāi)應(yīng)被撲滅、哪些火災(zāi)應(yīng)被允許燃燒的有效規(guī)則。這些規(guī)則能幫助節(jié)省資金,并有利于保護(hù)瀕危物種。
機(jī)器學(xué)習(xí)方法也可以用于繪制熊貓等瀕危物種的位置和種群地圖。在美國(guó),我們開(kāi)發(fā)了新的機(jī)器學(xué)習(xí)方法來(lái)預(yù)測(cè)和理解鳥(niǎo)類(lèi)遷徙。為新疾病、空氣污染和交通工具繪制傳播地圖也涉及類(lèi)似問(wèn)題。
在商業(yè)和金融方面,機(jī)器學(xué)習(xí)方法可以輔助識(shí)別欺詐和盜竊。我的工作小組一直在研究異常檢測(cè)的算法,它可以識(shí)別異常交易,并將其呈報(bào)給人工分析員,以對(duì)其進(jìn)行法律干預(yù)。
機(jī)器學(xué)習(xí)方法也有助于“智慧城市”的發(fā)展。我提到過(guò)交通管理和污染測(cè)繪,除了這些,機(jī)器學(xué)習(xí)技術(shù)也可以應(yīng)用于確定哪些地方需要新的基礎(chǔ)設(shè)施建設(shè)(例如供水、電力、網(wǎng)絡(luò))。在美國(guó),機(jī)器學(xué)習(xí)已被應(yīng)用于繪制20世紀(jì)老建筑物中使用神經(jīng)毒性鉛涂料的分布圖。
關(guān)于深度學(xué)習(xí)
能否評(píng)論一下深度學(xué)習(xí)的優(yōu)勢(shì)和劣勢(shì)?
迪特里奇:近來(lái)最激動(dòng)人心的發(fā)展就是對(duì)深度學(xué)習(xí)方法的研究浪潮。大多數(shù)機(jī)器學(xué)習(xí)方法要求數(shù)據(jù)科學(xué)家定義一組“特征”來(lái)描述每個(gè)輸入信息。比如,為了識(shí)別圖像中的對(duì)象,數(shù)據(jù)科學(xué)家首先需要從圖像中提取諸如邊緣、斑點(diǎn)和紋理區(qū)域等特征。然后將這些特征輸入到機(jī)器學(xué)習(xí)算法來(lái)識(shí)別相關(guān)對(duì)象。深度學(xué)習(xí)可以允許我們把原始圖像(像素)直接提供給學(xué)習(xí)算法,而無(wú)需事先定義和提取特征。我們發(fā)現(xiàn),深度學(xué)習(xí)可以習(xí)得正確的特征,而且它對(duì)這些特征的把握比我們通過(guò)人工編碼做得更好。因此,當(dāng)面對(duì)輸入信息(如圖像、語(yǔ)音信號(hào)等)和輸出信息(如對(duì)象、句子等)之間存在巨大差距的問(wèn)題時(shí),深度學(xué)習(xí)能夠做得比以前的機(jī)器學(xué)習(xí)方法好得多。
但是,有很多問(wèn)題的特征是易于提取的。例如,在欺詐檢測(cè)中,我們可能會(huì)檢查信用卡交易的數(shù)量、在何時(shí)何地發(fā)起交易等信息。這些信息已經(jīng)在高級(jí)特征中被表現(xiàn)出來(lái),而在這樣的應(yīng)用中,深度學(xué)習(xí)并不能提供太多的幫助。深度學(xué)習(xí)算法也很難訓(xùn)練,這需要大量的計(jì)算機(jī)時(shí)間,因此在大多數(shù)問(wèn)題中,它們并不是首選方法。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種特殊方法。它使用起來(lái)相當(dāng)困難,因此在一些特征明顯的問(wèn)題中,使用諸如隨機(jī)森林(random forests)或增強(qiáng)樹(shù)(boosted trees)之類(lèi)的方法通常會(huì)更好一些。這些方法易用且不需要太多經(jīng)驗(yàn)。它們也比深度學(xué)習(xí)方法快許多個(gè)數(shù)量級(jí),所以它們可以在筆記本電腦或智能手機(jī)上運(yùn)行,而不需要GPU超級(jí)計(jì)算機(jī)。機(jī)器學(xué)習(xí)工作的一個(gè)重要目標(biāo)就是使機(jī)器學(xué)習(xí)技術(shù)可以被只接受過(guò)很少甚至沒(méi)有接受過(guò)正式的機(jī)器學(xué)習(xí)訓(xùn)練的人們所使用。我是一家叫做BigML公司的首席科學(xué)家,我的公司開(kāi)發(fā)出了非常容易使用的基于決策樹(shù)方法(包括增強(qiáng)法和隨機(jī)森林法)的云端機(jī)器學(xué)習(xí)服務(wù)。
此外,還有將深度學(xué)習(xí)與標(biāo)準(zhǔn)人工智能技術(shù)相結(jié)合的有趣方法。最好的例子就是AlphaGo,它結(jié)合了深度學(xué)習(xí)(分析圍棋棋盤(pán)上的棋子布局)和蒙特卡羅樹(shù)搜索(提前搜索以判斷不同棋步的結(jié)果)。同樣,自動(dòng)駕駛汽車(chē)將頂層軟件(用于安全、控制和用戶界面)與用于計(jì)算機(jī)視覺(jué)和活動(dòng)識(shí)別的深度學(xué)習(xí)方法相結(jié)合。
機(jī)器學(xué)習(xí)的研究挑戰(zhàn)
能否評(píng)價(jià)一下機(jī)器學(xué)習(xí)研究面臨的挑戰(zhàn)?
迪特里奇:機(jī)器學(xué)習(xí)面臨許多重要的研究挑戰(zhàn)。第一個(gè)挑戰(zhàn)是改進(jìn)無(wú)監(jiān)督學(xué)習(xí)(unsupervised learning)和強(qiáng)化學(xué)習(xí)(reinforcement learning)的方法。幾乎所有最近的研究進(jìn)展都集中在所謂的“監(jiān)督學(xué)習(xí)”方面,即“老師”告訴計(jì)算機(jī)每個(gè)訓(xùn)練示例的正確答案??墒窃谠S多問(wèn)題上我們?nèi)鄙倮蠋?,卻擁有大量數(shù)據(jù)。比如當(dāng)我們?cè)噲D檢測(cè)異常交易或欺詐交易時(shí),就需要開(kāi)發(fā)可以從數(shù)據(jù)中學(xué)習(xí)而無(wú)需老師監(jiān)督的“異常檢測(cè)”算法。普遍而言,有許多類(lèi)別的“無(wú)監(jiān)督”學(xué)習(xí)算法可以在沒(méi)有老師的情況下學(xué)習(xí)。
需要更多研究的另一個(gè)領(lǐng)域是強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)通過(guò)給予獎(jiǎng)勵(lì)或懲罰來(lái)訓(xùn)練電腦執(zhí)行復(fù)雜任務(wù)。在許多問(wèn)題中,計(jì)算機(jī)可以自己計(jì)算獎(jiǎng)勵(lì),這使得計(jì)算機(jī)可以通過(guò)試錯(cuò)(trial and error)而不是老師提供的例子來(lái)學(xué)習(xí)。強(qiáng)化學(xué)習(xí)在解決控制問(wèn)題(如自動(dòng)駕駛汽車(chē)、機(jī)器人以及我前面提到的火災(zāi)管理問(wèn)題)方面特別有價(jià)值。強(qiáng)化學(xué)習(xí)的方法仍然很慢且很難應(yīng)用,所以研究人員正試圖尋找使其加速的方法。此外,現(xiàn)有的強(qiáng)化學(xué)習(xí)算法只在單一時(shí)間尺度上運(yùn)行,這使得這些方法難以在涉及不同時(shí)間尺度的問(wèn)題中學(xué)習(xí)。例如,學(xué)習(xí)將所駕駛的汽車(chē)保持在行車(chē)道內(nèi)的強(qiáng)化學(xué)習(xí)算法,無(wú)法同時(shí)學(xué)習(xí)規(guī)劃從一個(gè)地點(diǎn)到另一個(gè)地點(diǎn)的路線,因?yàn)檫@些決策在非常不同的時(shí)間尺度上發(fā)生。分層強(qiáng)化學(xué)習(xí)(hierarchical reinforcement learning)研究正在試圖解決這個(gè)問(wèn)題。
機(jī)器學(xué)習(xí)的第二個(gè)主要研究挑戰(zhàn)是驗(yàn)證(verification)、確認(rèn)(validation)和信任(trust)問(wèn)題。傳統(tǒng)的軟件系統(tǒng)經(jīng)常包含錯(cuò)誤(bugs),但由于軟件工程師可以讀取程序代碼,所以他們可以設(shè)計(jì)好的測(cè)試來(lái)檢查軟件中的問(wèn)題??墒菣C(jī)器學(xué)習(xí)的結(jié)果是一個(gè)“黑箱”(black box)系統(tǒng),它接受輸入并產(chǎn)生輸出,但難以從外部進(jìn)行檢查。因此,機(jī)器學(xué)習(xí)研究中一個(gè)非?;钴S的課題是開(kāi)發(fā)使機(jī)器學(xué)習(xí)系統(tǒng)更加容易被理解的方法(例如通過(guò)提供解釋或?qū)⑵浣Y(jié)果轉(zhuǎn)化為易于理解的形式)。還有驗(yàn)證和確認(rèn)黑箱系統(tǒng)的自動(dòng)化方法的研究。最有趣的新方向之一是創(chuàng)建試圖破壞機(jī)器學(xué)習(xí)系統(tǒng)的自動(dòng)化“對(duì)手”,它們常??梢园l(fā)現(xiàn)導(dǎo)致已學(xué)習(xí)程序(learned program)失敗的輸入。
與此相關(guān)的一個(gè)研究領(lǐng)域是“魯棒機(jī)器學(xué)習(xí)”(robust machine learning)。我們尋求即使在其預(yù)設(shè)被違反時(shí)仍然能良好工作的機(jī)器學(xué)習(xí)算法。機(jī)器學(xué)習(xí)中最大的假設(shè)是,訓(xùn)練數(shù)據(jù)是獨(dú)立分布的且是未來(lái)系統(tǒng)輸入的典型范例。幾位研究人員正在探索使機(jī)器學(xué)習(xí)系統(tǒng)在這種假設(shè)不成立時(shí)更加穩(wěn)健(魯棒)的方法。
機(jī)器學(xué)習(xí)的第三個(gè)主要挑戰(zhàn)是偏見(jiàn)問(wèn)題。采集數(shù)據(jù)的方式往往受到偏見(jiàn)的影響。例如關(guān)于新藥有效性的試驗(yàn)可能只在男性中進(jìn)行。機(jī)器學(xué)習(xí)系統(tǒng)可能會(huì)因此學(xué)習(xí)到,這些藥物只對(duì)35歲以上的人有效。但在女性中,效果可能會(huì)完全不同。一家公司可能從現(xiàn)有的客戶那里采集數(shù)據(jù),但這些數(shù)據(jù)對(duì)于預(yù)測(cè)新客戶的行為方式可能并沒(méi)有用,因?yàn)樾驴蛻艨赡茉谀承┲匾姆矫婧团f客戶有所不同(更年輕、更熟悉互聯(lián)網(wǎng)等)。目前的研究正在開(kāi)發(fā)一些方法來(lái)檢測(cè)這類(lèi)偏見(jiàn),并創(chuàng)造擺脫其影響的學(xué)習(xí)算法。
先進(jìn)人工智能帶來(lái)的威脅
隨著機(jī)器學(xué)習(xí)的快速發(fā)展,人類(lèi)的工作會(huì)受到機(jī)器的威脅嗎?您是否可以評(píng)價(jià)一下“奇點(diǎn)理論(Singularity Theory)”和關(guān)于高級(jí)人工智能風(fēng)險(xiǎn)的爭(zhēng)論?
迪特里奇:像所有新技術(shù)一樣,機(jī)器學(xué)習(xí)肯定會(huì)改變就業(yè)市場(chǎng)。 涉及簡(jiǎn)單重復(fù)性勞動(dòng)的工作——無(wú)論是重復(fù)性體力勞動(dòng)(如工廠作業(yè)和卡車(chē)駕駛),還是重復(fù)性智力勞動(dòng)(如法律、會(huì)計(jì)和醫(yī)學(xué)方面的許多工作)——可能至少部分地會(huì)被軟件和機(jī)器人取代。與工業(yè)革命時(shí)期一樣,隨著這些新技術(shù)的發(fā)展,經(jīng)濟(jì)可能會(huì)受到很大影響。重要的問(wèn)題是,機(jī)器學(xué)習(xí)和人工智能是否會(huì)創(chuàng)造新的工作。這種情況在工業(yè)革命時(shí)期發(fā)生過(guò),我認(rèn)為在人工智能革命中還會(huì)再次發(fā)生,但新產(chǎn)生的將是怎樣的工作還很難預(yù)測(cè)。
于是,我想到了最初開(kāi)發(fā)互聯(lián)網(wǎng)時(shí)都發(fā)生了什么。20世紀(jì)80年代初我大學(xué)畢業(yè),當(dāng)時(shí)互聯(lián)網(wǎng)協(xié)議被開(kāi)發(fā)部署,協(xié)議旨在將文件從一臺(tái)計(jì)算機(jī)轉(zhuǎn)移到另一臺(tái),從本地計(jì)算機(jī)登錄到遠(yuǎn)程計(jì)算機(jī)。我們那時(shí)還完全想不到會(huì)有萬(wàn)維網(wǎng)、搜索引擎、電子商務(wù)亦或是社交網(wǎng)絡(luò)!這意味著我們那時(shí)也無(wú)法預(yù)測(cè)出互聯(lián)網(wǎng)將會(huì)創(chuàng)造出哪些新的工作機(jī)會(huì)(網(wǎng)頁(yè)設(shè)計(jì)師、用戶體驗(yàn)工程師、數(shù)字廣告、推薦系統(tǒng)設(shè)計(jì)師、網(wǎng)絡(luò)安全工程師等等)。
我認(rèn)為今天同樣很難預(yù)測(cè)未來(lái)的工作將是怎樣的,但一定會(huì)有創(chuàng)造、訓(xùn)練、定制和維護(hù)人工智能系統(tǒng)的工作。我認(rèn)為對(duì)于大部分現(xiàn)有工作來(lái)說(shuō),完全自動(dòng)化的性價(jià)比并不高。相反,有可能每種工作的80%內(nèi)容將被自動(dòng)化,但剩下的20%依舊會(huì)由人來(lái)完成。如此,這個(gè)人會(huì)變得更有價(jià)值,并將得到優(yōu)厚的報(bào)酬。
我認(rèn)為在眾多人類(lèi)工作中,有一個(gè)方面很難被自動(dòng)化,那就是同理心(empathy)。機(jī)器人和人工智能系統(tǒng)與人類(lèi)將會(huì)有非常不同的經(jīng)驗(yàn)(experiences)。與人類(lèi)不同,它們無(wú)法“設(shè)身處地為別人著想”,因而無(wú)法理解人類(lèi),并和人類(lèi)產(chǎn)生情感共鳴。相反,像外星人或《星際迷航》中的數(shù)據(jù)少校(Commander Data),它們需要被訓(xùn)練,才能預(yù)測(cè)和理解人類(lèi)的情感。相比之下,人類(lèi)自然而然地就能做到這些事情,因?yàn)槲覀兌贾馈俺蔀槿祟?lèi)是怎樣一種感受”(what it feels like to be human)。因此,涉及同理心(例如咨詢、輔導(dǎo)、管理、客服)的工作最不可能實(shí)現(xiàn)令人滿意的自動(dòng)化,當(dāng)人類(lèi)客戶重視“真實(shí)的人際交互”而不接受與機(jī)器人或自動(dòng)化系統(tǒng)交互時(shí)尤其如此。
如果大多數(shù)工業(yè)和農(nóng)業(yè)生產(chǎn)實(shí)現(xiàn)自動(dòng)化以后,可以將由此產(chǎn)生的財(cái)富在社會(huì)中平均分配,那么人類(lèi)可以擁有更多時(shí)間去做其他事情。會(huì)有更多人去其他國(guó)家旅行以了解他國(guó)文化,體育、游戲、音樂(lè)和藝術(shù)也可能更加普及。一百年前,人們很難找到地方按摩或修腳,可現(xiàn)在這些服務(wù)幾乎到處都有。誰(shuí)又能知道一百年后,人們會(huì)想要做什么,想要擁有怎樣的體驗(yàn)?zāi)兀?/p>
關(guān)于“奇點(diǎn)”有兩種不同的流行觀念。讓我分別來(lái)談。美國(guó)發(fā)明家雷·庫(kù)茲韋爾(Ray Kurzweil)提出的概念是,由于許多技術(shù)以指數(shù)速度快速改進(jìn),所以對(duì)于久遠(yuǎn)未來(lái)的預(yù)測(cè)十分困難。這就是“技術(shù)奇點(diǎn)”(technological singularity)的想法,當(dāng)技術(shù)的改進(jìn)速率達(dá)到無(wú)限大,就會(huì)產(chǎn)生一個(gè)數(shù)學(xué)上的奇點(diǎn)。但這是不可能的,因?yàn)樗屑夹g(shù)都有限制(盡管我們不知道限制是什么)。美國(guó)經(jīng)濟(jì)學(xué)家赫伯特·斯坦因(Herbert Stein)提出過(guò)一個(gè)著名經(jīng)濟(jì)學(xué)法則:“一事若不能永續(xù),則必將停止”(If something can’t go on forever, it won’t)。摩爾定律(Moore’s Law)遵循這條法則,所有人工智能技術(shù)也都遵循這條法則。然而,即便真正的數(shù)學(xué)奇點(diǎn)不會(huì)出現(xiàn),我們目前確實(shí)正經(jīng)歷著人工智能系統(tǒng)功能的指數(shù)式增長(zhǎng),所以它們的未來(lái)功能將與當(dāng)前功能大不相同,用標(biāo)準(zhǔn)外推法推測(cè)它們的功能是不可能的。所以我相信庫(kù)茲韋爾是正確的,在這個(gè)呈指數(shù)變化的未來(lái)中我們看不到很遠(yuǎn)。
關(guān)于“奇點(diǎn)”的第二個(gè)概念是所謂的超級(jí)智能(superintelligence)的興起。這個(gè)說(shuō)法最早由英國(guó)數(shù)學(xué)家歐文·約翰·古德(I.J. Good)在1965年的一篇文章中提出,即在某個(gè)時(shí)間點(diǎn)人工智能技術(shù)將跨越一道門(mén)檻,它將能夠遞歸式地改善自身,然后迅速改進(jìn)并變得遠(yuǎn)比人類(lèi)聰明。那將是人類(lèi)的“最后發(fā)明”。通常情況下,這一門(mén)檻被認(rèn)為是“人類(lèi)層次的人工智能”(human-level AI),即人工智能系統(tǒng)能與人類(lèi)智能相提并論。我不相信這個(gè)說(shuō)法,主要有幾個(gè)原因。首先,機(jī)器學(xué)習(xí)的整體目標(biāo)是創(chuàng)建可以自主學(xué)習(xí)的計(jì)算機(jī)系統(tǒng)。這是一種自我完善(通常用于改進(jìn)學(xué)習(xí)系統(tǒng)本身,因此是遞歸式的自我完善)。然而,這樣的系統(tǒng)在完善自己時(shí)從來(lái)沒(méi)能超越一次迭代,也就是說(shuō),系統(tǒng)能完善自己,但是它所產(chǎn)生的系統(tǒng)卻不能自我完善。我認(rèn)為造成這種情況的原因是我們把這個(gè)問(wèn)題表達(dá)為一個(gè)函數(shù)優(yōu)化的問(wèn)題,而一旦你找到了這個(gè)函數(shù)的最優(yōu)值,則根據(jù)定義,進(jìn)一步的優(yōu)化將無(wú)法帶來(lái)任何改善。為了保持指數(shù)式改進(jìn),每項(xiàng)技術(shù)都需要反復(fù)突破。摩爾定律不是一個(gè)單一的過(guò)程,實(shí)際上是一個(gè)改進(jìn)的階梯,每一級(jí)臺(tái)階都涉及一個(gè)不同的突破。我相信這使我們回到了庫(kù)茲韋爾的技術(shù)奇點(diǎn),而不是超級(jí)智能。
第二,支持超級(jí)智能的論證把“能和人類(lèi)智慧相提并論”設(shè)定為人工智能發(fā)展的臨界點(diǎn),這是非??梢傻?。對(duì)我而言,這樣的說(shuō)法就像哥白尼和達(dá)爾文曾經(jīng)推翻的迂腐想法一樣具有誤導(dǎo)性。對(duì)于計(jì)算機(jī)可以獲得的智能而言,人類(lèi)可能并沒(méi)有任何特別之處。人類(lèi)智慧的限制很可能是由多種因素決定的,包括我們大腦的體積和計(jì)算能力、我們生命的長(zhǎng)度以及我們每個(gè)人都必須自己學(xué)習(xí)(而不是像并行和分布式計(jì)算機(jī)一樣)這一事實(shí)。計(jì)算機(jī)在處理很多任務(wù)上已經(jīng)比人類(lèi)更加智能化,包括作業(yè)車(chē)間調(diào)度、路線規(guī)劃、飛機(jī)控制、復(fù)雜系統(tǒng)(如大氣層)模擬、網(wǎng)絡(luò)搜索、記憶、計(jì)算、某些形式的定理證明等等。但是,所有這些超越人類(lèi)的能力都并沒(méi)有導(dǎo)致古德所描述的那種超級(jí)智能的誕生。
第三,我們觀察到在人類(lèi)中,智能往往涉及廣度而不是深度。像史蒂芬·霍金(Stephen Hawking)這樣偉大的物理學(xué)家比我更了解宇宙學(xué),但我在機(jī)器學(xué)習(xí)方面比他懂得更多。此外,實(shí)驗(yàn)表明,在某個(gè)方面是專(zhuān)家的人,在其他大多數(shù)方面都達(dá)不到平均水平。這就意味著將智能比作梯子的梯級(jí)——這正是遞歸式自我完善論證的基礎(chǔ)——是錯(cuò)誤的比喻。相反,我們應(yīng)該把智能比作在桌面上擴(kuò)散的液體,或比作生物多樣性,每個(gè)知識(shí)分支都在人類(lèi)智能的雨林中占據(jù)一個(gè)生態(tài)位。在這樣的比喻中,并沒(méi)有暗示出一個(gè)門(mén)檻的存在,一旦跨越就會(huì)誕生超級(jí)智能。
我主張庫(kù)茲韋爾關(guān)于奇點(diǎn)的看法是正確的,但這并不意味著人工智能技術(shù)本質(zhì)上是安全的,無(wú)需擔(dān)心的。事實(shí)上遠(yuǎn)非如此。確實(shí),計(jì)算機(jī)在變得更加智能,驅(qū)使我們嘗試使用計(jì)算機(jī)承擔(dān)高風(fēng)險(xiǎn)決策,例如控制無(wú)人駕駛汽車(chē)、管理電網(wǎng)或參與戰(zhàn)爭(zhēng)(作為自主武器系統(tǒng))等。但正如我前面提到的,當(dāng)前的機(jī)器學(xué)習(xí)技術(shù)尚未可靠或穩(wěn)健到能被委以重任,負(fù)責(zé)如此危險(xiǎn)的決策。我非常擔(dān)心人工智能技術(shù)的過(guò)早部署,可能會(huì)產(chǎn)生由于機(jī)器學(xué)習(xí)組件中存在某種錯(cuò)誤(bug)而導(dǎo)致重大傷亡的情況。像《2001太空漫游》中的HAL 9000一樣,如果我們給予計(jì)算機(jī)對(duì)重要系統(tǒng)的自主控制權(quán),但隨后又出現(xiàn)了編程錯(cuò)誤或機(jī)器學(xué)習(xí)故障,計(jì)算機(jī)將可能會(huì)“接管世界”。我不認(rèn)為計(jì)算機(jī)會(huì)自發(fā)地“決定”接管世界,那只是一個(gè)科幻小說(shuō)中的故事情節(jié)。我也不認(rèn)為計(jì)算機(jī)會(huì)“想要變得和我們一樣”,這是另一個(gè)至少可以追溯到匹諾曹的故事情節(jié)(也許在中國(guó)文化中還有更古老的故事?)。
人類(lèi)決策可能不如計(jì)算機(jī)準(zhǔn)確快速,但是在面對(duì)意料之外的情況時(shí),我們更加穩(wěn)健,能夠更好地識(shí)別和應(yīng)對(duì)計(jì)算機(jī)系統(tǒng)中的故障。也正因如此,我認(rèn)為在所有高風(fēng)險(xiǎn)決策的過(guò)程中,人類(lèi)都不應(yīng)當(dāng)缺席。
其他
在美國(guó),已經(jīng)有許多機(jī)器學(xué)習(xí)領(lǐng)域的教授離開(kāi)高校,進(jìn)入大公司任職。您如何看待這一現(xiàn)象?
迪特里奇:是的,教授加入公司已經(jīng)造成了顯著的“人才流失”(brain drain)。這一現(xiàn)象的產(chǎn)生有幾個(gè)原因:首先,在新型人工智能產(chǎn)品的開(kāi)發(fā)中存在激烈的公司間競(jìng)爭(zhēng),所以很多公司會(huì)向教授支付非常高的薪水;第二,由于許多機(jī)器學(xué)習(xí)技術(shù)(特別是深度學(xué)習(xí))需要大量的數(shù)據(jù),而公司能夠采集并提供這些數(shù)據(jù),所以在企業(yè)研究“大數(shù)據(jù)”和深度學(xué)習(xí)要比在高校里容易得多;第三,公司還可以購(gòu)買(mǎi)或開(kāi)發(fā)用于深度學(xué)習(xí)的專(zhuān)用計(jì)算機(jī),如GPU計(jì)算機(jī)或谷歌的Tensor處理單元(TPUs)等,這是另一件很難在高校里實(shí)現(xiàn)的事情。
這會(huì)帶來(lái)怎樣的影響呢?主要的影響是,由于從事教學(xué)和科研指導(dǎo)的教授數(shù)量下降,高校能夠訓(xùn)練和培養(yǎng)的人工智能和機(jī)器學(xué)習(xí)領(lǐng)域?qū)W生的數(shù)量下降了。高校訪問(wèn)大數(shù)據(jù)集和使用專(zhuān)用計(jì)算機(jī)的通道也變得狹窄,為解決這一問(wèn)題,企業(yè)和政府應(yīng)當(dāng)提供更多經(jīng)費(fèi),來(lái)幫助高校進(jìn)行數(shù)據(jù)集采集和購(gòu)買(mǎi)專(zhuān)用計(jì)算機(jī)。我不知道政府如何才能解決高校人才流失問(wèn)題,但它可以幫助解決數(shù)據(jù)和計(jì)算方面的問(wèn)題。
除大數(shù)據(jù)和深度學(xué)習(xí)外,所有其他形式的機(jī)器學(xué)習(xí)(以及上面列出的所有挑戰(zhàn))研究都不難在高校實(shí)驗(yàn)室中開(kāi)展,例如在俄勒岡州立大學(xué)的實(shí)驗(yàn)室里,我們正在研究異常檢測(cè)、強(qiáng)化學(xué)習(xí)和健壯機(jī)器學(xué)習(xí)。
能否評(píng)價(jià)一下中國(guó)對(duì)這一領(lǐng)域的貢獻(xiàn)和影響?你認(rèn)為是否存在某些因素限制了中國(guó)研究者能力的發(fā)揮?
迪特里奇:中國(guó)科學(xué)家(包括在中國(guó)境內(nèi)外工作的)正在為機(jī)器學(xué)習(xí)和人工智能技術(shù)的發(fā)展做出巨大貢獻(xiàn)。中國(guó)是語(yǔ)音識(shí)別和自然語(yǔ)言翻譯深度學(xué)習(xí)領(lǐng)域的領(lǐng)導(dǎo)者。由于政府和企業(yè)對(duì)中國(guó)人工智能研究的大量投入,我期待中國(guó)研究人員能做出更多的貢獻(xiàn)。我認(rèn)為(阻礙中國(guó)研究人員)產(chǎn)生更大影響力的最大障礙就是溝通。大多數(shù)計(jì)算機(jī)科學(xué)研究成果都是用英文出版的,而英語(yǔ)對(duì)于說(shuō)普通話的人來(lái)說(shuō)很難學(xué),所以中國(guó)科學(xué)家很難(用英語(yǔ))寫(xiě)論文或是做具有重大影響的報(bào)告。反過(guò)來(lái)也有同樣的問(wèn)題。中國(guó)現(xiàn)在是人工智能研究的主要陣營(yíng)(我猜至少占25%)。西方人不懂中文,就很難了解中國(guó)的進(jìn)步。我希望語(yǔ)言翻譯技術(shù)的不斷改進(jìn)將有助于減少語(yǔ)言障礙。和溝通有關(guān)的問(wèn)題還有,中國(guó)的網(wǎng)絡(luò)常常難以與世界其他地區(qū)的網(wǎng)絡(luò)相連接,從而使召開(kāi)電話會(huì)議或Skype會(huì)議存在困難,這就意味著中國(guó)的研究人員常常不會(huì)被納入到國(guó)際研究項(xiàng)目中去。
對(duì)于進(jìn)入這一領(lǐng)域的年輕研究人員,您有什么建議?
迪特里奇:我的第一個(gè)建議是學(xué)生應(yīng)盡可能多地學(xué)習(xí)數(shù)學(xué)。數(shù)學(xué)是機(jī)器學(xué)習(xí)的核心。數(shù)學(xué)很難自學(xué),所以我建議所有學(xué)生都在大學(xué)期間學(xué)習(xí)數(shù)學(xué)。我的第二個(gè)建議是盡可能多地閱讀文獻(xiàn),不要只讀深度學(xué)習(xí)的論文,也要閱讀機(jī)器學(xué)習(xí)、人工智能和算法相關(guān)的理論。新的學(xué)習(xí)算法源自對(duì)數(shù)學(xué)和優(yōu)化問(wèn)題結(jié)構(gòu)的深刻理解。不要忘記其他知識(shí)分支(如統(tǒng)計(jì)、運(yùn)營(yíng)研究、信息理論、經(jīng)濟(jì)學(xué)、博弈論、科學(xué)哲學(xué)、神經(jīng)科學(xué)、心理學(xué)等)的概念對(duì)機(jī)器學(xué)習(xí)和人工智能的發(fā)展一直非常重要。另外,團(tuán)隊(duì)合作經(jīng)驗(yàn)很有價(jià)值?,F(xiàn)在的大多數(shù)研究都是合作完成的,所以你應(yīng)該練習(xí)團(tuán)隊(duì)合作和學(xué)習(xí)解決沖突。最后,培養(yǎng)你的編程和溝通技巧非常重要。你要學(xué)習(xí)編程并掌握最新的軟件工程工具,你還要能寫(xiě)會(huì)說(shuō):掌握英語(yǔ)語(yǔ)法和詞匯還遠(yuǎn)遠(yuǎn)不夠,你必須學(xué)會(huì)如何在具體的場(chǎng)合里,將你復(fù)雜研究成果的核心觀點(diǎn)清晰地傳達(dá)出來(lái)。
原文2017年5月2日首次發(fā)表于《國(guó)家科學(xué)評(píng)論》,原標(biāo)題為“Machine learning challenges and impact: an interview with Thomas Dietterich”。
NSR是科學(xué)出版社旗下期刊,與牛津大學(xué)出版社聯(lián)合出版。
《知識(shí)分子》獲授權(quán)刊發(fā)該文中文翻譯。
原文鏈接:
https://doi.org/10.1093/nsr/nwx045