對話國際機(jī)器學(xué)習(xí)協(xié)會創(chuàng)始主席:超級人工智能是“人類最后的發(fā)明”嗎?| NSR專欄
?美國俄勒岡州立大學(xué)計算機(jī)科學(xué)榮譽(yù)教授托馬斯·迪特里奇(Thomas Dietterich)
撰文 | 周志華
翻譯 | 初 浩
校譯 | 張志鵬
責(zé)編 | 陳曉雪
● ● ●
機(jī)器學(xué)習(xí)是人工智能(AI)熱潮的一大驅(qū)動力。不久前,美國俄勒岡州立大學(xué)計算機(jī)科學(xué)榮譽(yù)教授、國際人工智能促進(jìn)協(xié)會(AAAI,人工智能領(lǐng)域最負(fù)盛名的協(xié)會)前主席及國際機(jī)器學(xué)習(xí)協(xié)會創(chuàng)始主席托馬斯·迪特里奇(Thomas Dietterich)教授接受《國家科學(xué)評論》(NSR)采訪,談到了機(jī)器學(xué)習(xí)的最新進(jìn)展和技術(shù)挑戰(zhàn),以及其對世界的巨大影響。
機(jī)器學(xué)習(xí)為什么重要
NSR:機(jī)器學(xué)習(xí)有什么用?
迪特里奇:機(jī)器學(xué)習(xí)為開發(fā)高性能軟件提供了新的方法。在傳統(tǒng)的軟件開發(fā)過程中,我們與用戶交談,規(guī)劃用戶需求,然后根據(jù)需求,設(shè)計、實施和測試滿足這些需求的算法。通過機(jī)器學(xué)習(xí),我們?nèi)詴贫ㄜ浖到y(tǒng)的整體目標(biāo),但我們自己并不設(shè)計算法,而是收集訓(xùn)練案例(通常是通過人工標(biāo)注數(shù)據(jù)點),然后應(yīng)用機(jī)器學(xué)習(xí)算法來自動學(xué)習(xí)所需的功能。
這些由新方法開發(fā)出的軟件,可以為我們解決傳統(tǒng)軟件工程方法所解決不了的許多問題。具體來說,從前的視覺對象檢測和識別、語音識別和語言翻譯方法的性能達(dá)不到可用水平。但是隨著機(jī)器學(xué)習(xí)最近的進(jìn)步,我們現(xiàn)在擁有了可以執(zhí)行這些任務(wù)的系統(tǒng),其準(zhǔn)確性(或多或少)可與人類的表現(xiàn)相媲美。
因此,機(jī)器學(xué)習(xí)這一關(guān)鍵技術(shù)使許多應(yīng)用成為現(xiàn)實,比如自動駕駛汽車、實時駕駛指引、跨語言用戶界面及支持語音的用戶界面等。機(jī)器學(xué)習(xí)對于網(wǎng)頁搜索引擎、推薦系統(tǒng)和個性化廣告也很有價值。許多人預(yù)測機(jī)器學(xué)習(xí)方法將導(dǎo)致一場醫(yī)學(xué)革命,特別是在醫(yī)學(xué)圖像的自動收集和分析領(lǐng)域。機(jī)器學(xué)習(xí)在現(xiàn)代公司的運(yùn)營方面也是一種前景良好的工具,例如它可以幫助預(yù)測客戶需求并優(yōu)化供應(yīng)鏈。它也是訓(xùn)練機(jī)器人執(zhí)行靈活制造任務(wù)的關(guān)鍵技術(shù)。
NSR:為什么說機(jī)器學(xué)習(xí)對科學(xué)界和社會都很重要?
迪特里奇:機(jī)器學(xué)習(xí)方法可以幫助收集和分析數(shù)據(jù),例如,機(jī)器學(xué)習(xí)方法和技術(shù)可用于分析大型強(qiáng)子對撞機(jī)收集的大量數(shù)據(jù),也對天文數(shù)據(jù)的分析至關(guān)重要。通過輔助設(shè)計實驗,機(jī)器學(xué)習(xí)技術(shù)可以幫助科學(xué)家決定需要收集哪些數(shù)據(jù),隨后機(jī)器人系統(tǒng)可以在實驗室或現(xiàn)實世界中自動執(zhí)行這些實驗,例如由Ross King開發(fā)的“自動化科學(xué)家”程序可以設(shè)計、執(zhí)行和分析它自己的實驗,遠(yuǎn)洋滑翔機(jī)器人也是由人工智能系統(tǒng)控制的。機(jī)器學(xué)習(xí)技術(shù)也開始應(yīng)用于控制那些在生態(tài)系統(tǒng)和城市中收集數(shù)據(jù)的無人機(jī)。
我個人的研究重點是應(yīng)用機(jī)器學(xué)習(xí)來改善我們對地球生態(tài)系統(tǒng)的管理。例如,在俄勒岡州,經(jīng)常發(fā)生雷電造成的森林火災(zāi)。這些火災(zāi)可以摧毀瀕危物種的棲息地,燒毀本可能用于建造房屋的樹木。導(dǎo)致這些大火的原因之一,是美國撲滅了多年來的每一起火災(zāi)。這一做法非常昂貴,也使得可燃物在森林中累積。所以,當(dāng)發(fā)生新的火災(zāi)時,燃燒會十分劇烈且更具破壞性。我們正在應(yīng)用機(jī)器學(xué)習(xí)(強(qiáng)化學(xué)習(xí))方法來找出決定哪些火災(zāi)應(yīng)被撲滅、哪些火災(zāi)應(yīng)被允許燃燒的有效規(guī)則。這些規(guī)則能幫助節(jié)省資金,并有利于保護(hù)瀕危物種。
機(jī)器學(xué)習(xí)方法也可以用于繪制熊貓等瀕危物種的位置和種群地圖。在美國,我們開發(fā)了新的機(jī)器學(xué)習(xí)方法來預(yù)測和理解鳥類遷徙。為新疾病、空氣污染和交通工具繪制傳播地圖也涉及類似問題。
在商業(yè)和金融方面,機(jī)器學(xué)習(xí)方法可以輔助識別欺詐和盜竊。我的工作小組一直在研究異常檢測的算法,它可以識別異常交易,并將其呈報給人工分析員,以對其進(jìn)行法律干預(yù)。
機(jī)器學(xué)習(xí)方法也有助于“智慧城市”的發(fā)展。我提到過交通管理和污染測繪,除了這些,機(jī)器學(xué)習(xí)技術(shù)也可以應(yīng)用于確定哪些地方需要新的基礎(chǔ)設(shè)施建設(shè)(例如供水、電力、網(wǎng)絡(luò))。在美國,機(jī)器學(xué)習(xí)已被應(yīng)用于繪制20世紀(jì)老建筑物中使用神經(jīng)毒性鉛涂料的分布圖。
關(guān)于深度學(xué)習(xí)
NSR:能否評論一下深度學(xué)習(xí)的優(yōu)勢和劣勢?
迪特里奇:近來最激動人心的發(fā)展就是對深度學(xué)習(xí)方法的研究浪潮。大多數(shù)機(jī)器學(xué)習(xí)方法要求數(shù)據(jù)科學(xué)家定義一組“特征”來描述每個輸入信息。比如,為了識別圖像中的對象,數(shù)據(jù)科學(xué)家首先需要從圖像中提取諸如邊緣、斑點和紋理區(qū)域等特征。然后將這些特征輸入到機(jī)器學(xué)習(xí)算法來識別相關(guān)對象。深度學(xué)習(xí)可以允許我們把原始圖像(像素)直接提供給學(xué)習(xí)算法,而無需事先定義和提取特征。我們發(fā)現(xiàn),深度學(xué)習(xí)可以習(xí)得正確的特征,而且它對這些特征的把握比我們通過人工編碼做得更好。因此,當(dāng)面對輸入信息(如圖像、語音信號等)和輸出信息(如對象、句子等)之間存在巨大差距的問題時,深度學(xué)習(xí)能夠做得比以前的機(jī)器學(xué)習(xí)方法好得多。
但是,有很多問題的特征是易于提取的。例如,在欺詐檢測中,我們可能會檢查信用卡交易的數(shù)量、在何時何地發(fā)起交易等信息。這些信息已經(jīng)在高級特征中被表現(xiàn)出來,而在這樣的應(yīng)用中,深度學(xué)習(xí)并不能提供太多的幫助。深度學(xué)習(xí)算法也很難訓(xùn)練,這需要大量的計算機(jī)時間,因此在大多數(shù)問題中,它們并不是首選方法。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種特殊方法。它使用起來相當(dāng)困難,因此在一些特征明顯的問題中,使用諸如隨機(jī)森林(random forests)或增強(qiáng)樹(boosted trees)之類的方法通常會更好一些。這些方法易用且不需要太多經(jīng)驗。它們也比深度學(xué)習(xí)方法快許多個數(shù)量級,所以它們可以在筆記本電腦或智能手機(jī)上運(yùn)行,而不需要GPU超級計算機(jī)。機(jī)器學(xué)習(xí)工作的一個重要目標(biāo)就是使機(jī)器學(xué)習(xí)技術(shù)可以被只接受過很少甚至沒有接受過正式的機(jī)器學(xué)習(xí)訓(xùn)練的人們所使用。我是一家叫做BigML公司的首席科學(xué)家,我的公司開發(fā)出了非常容易使用的基于決策樹方法(包括增強(qiáng)法和隨機(jī)森林法)的云端機(jī)器學(xué)習(xí)服務(wù)。
此外,還有將深度學(xué)習(xí)與標(biāo)準(zhǔn)人工智能技術(shù)相結(jié)合的有趣方法。最好的例子就是AlphaGo,它結(jié)合了深度學(xué)習(xí)(分析圍棋棋盤上的棋子布局)和蒙特卡羅樹搜索(提前搜索以判斷不同棋步的結(jié)果)。同樣,自動駕駛汽車將頂層軟件(用于安全、控制和用戶界面)與用于計算機(jī)視覺和活動識別的深度學(xué)習(xí)方法相結(jié)合。
機(jī)器學(xué)習(xí)的研究挑戰(zhàn)
NSR:能否評價一下機(jī)器學(xué)習(xí)研究面臨的挑戰(zhàn)?
迪特里奇:機(jī)器學(xué)習(xí)面臨許多重要的研究挑戰(zhàn)。第一個挑戰(zhàn)是改進(jìn)無監(jiān)督學(xué)習(xí)(unsupervised learning)和強(qiáng)化學(xué)習(xí)(reinforcement learning)的方法。幾乎所有最近的研究進(jìn)展都集中在所謂的“監(jiān)督學(xué)習(xí)”方面,即“老師”告訴計算機(jī)每個訓(xùn)練示例的正確答案??墒窃谠S多問題上我們?nèi)鄙倮蠋?,卻擁有大量數(shù)據(jù)。比如當(dāng)我們試圖檢測異常交易或欺詐交易時,就需要開發(fā)可以從數(shù)據(jù)中學(xué)習(xí)而無需老師監(jiān)督的“異常檢測”算法。普遍而言,有許多類別的“無監(jiān)督”學(xué)習(xí)算法可以在沒有老師的情況下學(xué)習(xí)。
需要更多研究的另一個領(lǐng)域是強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)通過給予獎勵或懲罰來訓(xùn)練電腦執(zhí)行復(fù)雜任務(wù)。在許多問題中,計算機(jī)可以自己計算獎勵,這使得計算機(jī)可以通過試錯(trial and error)而不是老師提供的例子來學(xué)習(xí)。強(qiáng)化學(xué)習(xí)在解決控制問題(如自動駕駛汽車、機(jī)器人以及我前面提到的火災(zāi)管理問題)方面特別有價值。強(qiáng)化學(xué)習(xí)的方法仍然很慢且很難應(yīng)用,所以研究人員正試圖尋找使其加速的方法。此外,現(xiàn)有的強(qiáng)化學(xué)習(xí)算法只在單一時間尺度上運(yùn)行,這使得這些方法難以在涉及不同時間尺度的問題中學(xué)習(xí)。例如,學(xué)習(xí)將所駕駛的汽車保持在行車道內(nèi)的強(qiáng)化學(xué)習(xí)算法,無法同時學(xué)習(xí)規(guī)劃從一個地點到另一個地點的路線,因為這些決策在非常不同的時間尺度上發(fā)生。分層強(qiáng)化學(xué)習(xí)(hierarchical reinforcement learning)研究正在試圖解決這個問題。
機(jī)器學(xué)習(xí)的第二個主要研究挑戰(zhàn)是驗證(verification)、確認(rèn)(validation)和信任(trust)問題。傳統(tǒng)的軟件系統(tǒng)經(jīng)常包含錯誤(bugs),但由于軟件工程師可以讀取程序代碼,所以他們可以設(shè)計好的測試來檢查軟件中的問題。可是機(jī)器學(xué)習(xí)的結(jié)果是一個“黑箱”(black box)系統(tǒng),它接受輸入并產(chǎn)生輸出,但難以從外部進(jìn)行檢查。因此,機(jī)器學(xué)習(xí)研究中一個非?;钴S的課題是開發(fā)使機(jī)器學(xué)習(xí)系統(tǒng)更加容易被理解的方法(例如通過提供解釋或?qū)⑵浣Y(jié)果轉(zhuǎn)化為易于理解的形式)。還有驗證和確認(rèn)黑箱系統(tǒng)的自動化方法的研究。最有趣的新方向之一是創(chuàng)建試圖破壞機(jī)器學(xué)習(xí)系統(tǒng)的自動化“對手”,它們常??梢园l(fā)現(xiàn)導(dǎo)致已學(xué)習(xí)程序(learned program)失敗的輸入。
與此相關(guān)的一個研究領(lǐng)域是“魯棒機(jī)器學(xué)習(xí)”(robust machine learning)。我們尋求即使在其預(yù)設(shè)被違反時仍然能良好工作的機(jī)器學(xué)習(xí)算法。機(jī)器學(xué)習(xí)中最大的假設(shè)是,訓(xùn)練數(shù)據(jù)是獨(dú)立分布的且是未來系統(tǒng)輸入的典型范例。幾位研究人員正在探索使機(jī)器學(xué)習(xí)系統(tǒng)在這種假設(shè)不成立時更加穩(wěn)健(魯棒)的方法。
機(jī)器學(xué)習(xí)的第三個主要挑戰(zhàn)是偏見問題。采集數(shù)據(jù)的方式往往受到偏見的影響。例如關(guān)于新藥有效性的試驗可能只在男性中進(jìn)行。機(jī)器學(xué)習(xí)系統(tǒng)可能會因此學(xué)習(xí)到,這些藥物只對35歲以上的人有效。但在女性中,效果可能會完全不同。一家公司可能從現(xiàn)有的客戶那里采集數(shù)據(jù),但這些數(shù)據(jù)對于預(yù)測新客戶的行為方式可能并沒有用,因為新客戶可能在某些重要的方面和舊客戶有所不同(更年輕、更熟悉互聯(lián)網(wǎng)等)。目前的研究正在開發(fā)一些方法來檢測這類偏見,并創(chuàng)造擺脫其影響的學(xué)習(xí)算法。
先進(jìn)人工智能帶來的威脅
NSR:隨著機(jī)器學(xué)習(xí)的快速發(fā)展,人類的工作會受到機(jī)器的威脅嗎?您是否可以評價一下“奇點理論(Singularity Theory)”和關(guān)于高級人工智能風(fēng)險的爭論?
迪特里奇:像所有新技術(shù)一樣,機(jī)器學(xué)習(xí)肯定會改變就業(yè)市場。 涉及簡單重復(fù)性勞動的工作——無論是重復(fù)性體力勞動(如工廠作業(yè)和卡車駕駛),還是重復(fù)性智力勞動(如法律、會計和醫(yī)學(xué)方面的許多工作)——可能至少部分地會被軟件和機(jī)器人取代。與工業(yè)革命時期一樣,隨著這些新技術(shù)的發(fā)展,經(jīng)濟(jì)可能會受到很大影響。重要的問題是,機(jī)器學(xué)習(xí)和人工智能是否會創(chuàng)造新的工作。這種情況在工業(yè)革命時期發(fā)生過,我認(rèn)為在人工智能革命中還會再次發(fā)生,但新產(chǎn)生的將是怎樣的工作還很難預(yù)測。
于是,我想到了最初開發(fā)互聯(lián)網(wǎng)時都發(fā)生了什么。20世紀(jì)80年代初我大學(xué)畢業(yè),當(dāng)時互聯(lián)網(wǎng)協(xié)議被開發(fā)部署,協(xié)議旨在將文件從一臺計算機(jī)轉(zhuǎn)移到另一臺,從本地計算機(jī)登錄到遠(yuǎn)程計算機(jī)。我們那時還完全想不到會有萬維網(wǎng)、搜索引擎、電子商務(wù)亦或是社交網(wǎng)絡(luò)!這意味著我們那時也無法預(yù)測出互聯(lián)網(wǎng)將會創(chuàng)造出哪些新的工作機(jī)會(網(wǎng)頁設(shè)計師、用戶體驗工程師、數(shù)字廣告、推薦系統(tǒng)設(shè)計師、網(wǎng)絡(luò)安全工程師等等)。
我認(rèn)為今天同樣很難預(yù)測未來的工作將是怎樣的,但一定會有創(chuàng)造、訓(xùn)練、定制和維護(hù)人工智能系統(tǒng)的工作。我認(rèn)為對于大部分現(xiàn)有工作來說,完全自動化的性價比并不高。相反,有可能每種工作的80%內(nèi)容將被自動化,但剩下的20%依舊會由人來完成。如此,這個人會變得更有價值,并將得到優(yōu)厚的報酬。
我認(rèn)為在眾多人類工作中,有一個方面很難被自動化,那就是同理心(empathy)。機(jī)器人和人工智能系統(tǒng)與人類將會有非常不同的經(jīng)驗(experiences)。與人類不同,它們無法“設(shè)身處地為別人著想”,因而無法理解人類,并和人類產(chǎn)生情感共鳴。相反,像外星人或《星際迷航》中的數(shù)據(jù)少校(Commander Data),它們需要被訓(xùn)練,才能預(yù)測和理解人類的情感。相比之下,人類自然而然地就能做到這些事情,因為我們都知道“成為人類是怎樣一種感受”(what it feels like to be human)。因此,涉及同理心(例如咨詢、輔導(dǎo)、管理、客服)的工作最不可能實現(xiàn)令人滿意的自動化,當(dāng)人類客戶重視“真實的人際交互”而不接受與機(jī)器人或自動化系統(tǒng)交互時尤其如此。
如果大多數(shù)工業(yè)和農(nóng)業(yè)生產(chǎn)實現(xiàn)自動化以后,可以將由此產(chǎn)生的財富在社會中平均分配,那么人類可以擁有更多時間去做其他事情。會有更多人去其他國家旅行以了解他國文化,體育、游戲、音樂和藝術(shù)也可能更加普及。一百年前,人們很難找到地方按摩或修腳,可現(xiàn)在這些服務(wù)幾乎到處都有。誰又能知道一百年后,人們會想要做什么,想要擁有怎樣的體驗?zāi)兀?/p>
關(guān)于“奇點”有兩種不同的流行觀念。讓我分別來談。美國發(fā)明家雷·庫茲韋爾(Ray Kurzweil)提出的概念是,由于許多技術(shù)以指數(shù)速度快速改進(jìn),所以對于久遠(yuǎn)未來的預(yù)測十分困難。這就是“技術(shù)奇點”(technological singularity)的想法,當(dāng)技術(shù)的改進(jìn)速率達(dá)到無限大,就會產(chǎn)生一個數(shù)學(xué)上的奇點。但這是不可能的,因為所有技術(shù)都有限制(盡管我們不知道限制是什么)。美國經(jīng)濟(jì)學(xué)家赫伯特·斯坦因(Herbert Stein)提出過一個著名經(jīng)濟(jì)學(xué)法則:“一事若不能永續(xù),則必將停止”(If something can’t go on forever, it won’t)。摩爾定律(Moore’s Law)遵循這條法則,所有人工智能技術(shù)也都遵循這條法則。然而,即便真正的數(shù)學(xué)奇點不會出現(xiàn),我們目前確實正經(jīng)歷著人工智能系統(tǒng)功能的指數(shù)式增長,所以它們的未來功能將與當(dāng)前功能大不相同,用標(biāo)準(zhǔn)外推法推測它們的功能是不可能的。所以我相信庫茲韋爾是正確的,在這個呈指數(shù)變化的未來中我們看不到很遠(yuǎn)。
關(guān)于“奇點”的第二個概念是所謂的超級智能(superintelligence)的興起。這個說法最早由英國數(shù)學(xué)家歐文·約翰·古德(I.J. Good)在1965年的一篇文章中提出,即在某個時間點人工智能技術(shù)將跨越一道門檻,它將能夠遞歸式地改善自身,然后迅速改進(jìn)并變得遠(yuǎn)比人類聰明。那將是人類的“最后發(fā)明”。通常情況下,這一門檻被認(rèn)為是“人類層次的人工智能”(human-level AI),即人工智能系統(tǒng)能與人類智能相提并論。我不相信這個說法,主要有幾個原因。
首先,機(jī)器學(xué)習(xí)的整體目標(biāo)是創(chuàng)建可以自主學(xué)習(xí)的計算機(jī)系統(tǒng)。這是一種自我完善(通常用于改進(jìn)學(xué)習(xí)系統(tǒng)本身,因此是遞歸式的自我完善)。然而,這樣的系統(tǒng)在完善自己時從來沒能超越一次迭代,也就是說,系統(tǒng)能完善自己,但是它所產(chǎn)生的系統(tǒng)卻不能自我完善。我認(rèn)為造成這種情況的原因是我們把這個問題表達(dá)為一個函數(shù)優(yōu)化的問題,而一旦你找到了這個函數(shù)的最優(yōu)值,則根據(jù)定義,進(jìn)一步的優(yōu)化將無法帶來任何改善。為了保持指數(shù)式改進(jìn),每項技術(shù)都需要反復(fù)突破。摩爾定律不是一個單一的過程,實際上是一個改進(jìn)的階梯,每一級臺階都涉及一個不同的突破。我相信這使我們回到了庫茲韋爾的技術(shù)奇點,而不是超級智能。
第二,支持超級智能的論證把“能和人類智慧相提并論”設(shè)定為人工智能發(fā)展的臨界點,這是非常可疑的。對我而言,這樣的說法就像哥白尼和達(dá)爾文曾經(jīng)推翻的迂腐想法一樣具有誤導(dǎo)性。對于計算機(jī)可以獲得的智能而言,人類可能并沒有任何特別之處。人類智慧的限制很可能是由多種因素決定的,包括我們大腦的體積和計算能力、我們生命的長度以及我們每個人都必須自己學(xué)習(xí)(而不是像并行和分布式計算機(jī)一樣)這一事實。計算機(jī)在處理很多任務(wù)上已經(jīng)比人類更加智能化,包括作業(yè)車間調(diào)度、路線規(guī)劃、飛機(jī)控制、復(fù)雜系統(tǒng)(如大氣層)模擬、網(wǎng)絡(luò)搜索、記憶、計算、某些形式的定理證明等等。但是,所有這些超越人類的能力都并沒有導(dǎo)致古德所描述的那種超級智能的誕生。
第三,我們觀察到在人類中,智能往往涉及廣度而不是深度。像史蒂芬·霍金(Stephen Hawking)這樣偉大的物理學(xué)家比我更了解宇宙學(xué),但我在機(jī)器學(xué)習(xí)方面比他懂得更多。此外,實驗表明,在某個方面是專家的人,在其他大多數(shù)方面都達(dá)不到平均水平。這就意味著將智能比作梯子的梯級——這正是遞歸式自我完善論證的基礎(chǔ)——是錯誤的比喻。相反,我們應(yīng)該把智能比作在桌面上擴(kuò)散的液體,或比作生物多樣性,每個知識分支都在人類智能的雨林中占據(jù)一個生態(tài)位。在這樣的比喻中,并沒有暗示出一個門檻的存在,一旦跨越就會誕生超級智能。
我主張庫茲韋爾關(guān)于奇點的看法是正確的,但這并不意味著人工智能技術(shù)本質(zhì)上是安全的,無需擔(dān)心的。事實上遠(yuǎn)非如此。確實,計算機(jī)在變得更加智能,驅(qū)使我們嘗試使用計算機(jī)承擔(dān)高風(fēng)險決策,例如控制無人駕駛汽車、管理電網(wǎng)或參與戰(zhàn)爭(作為自主武器系統(tǒng))等。但正如我前面提到的,當(dāng)前的機(jī)器學(xué)習(xí)技術(shù)尚未可靠或穩(wěn)健到能被委以重任,負(fù)責(zé)如此危險的決策。我非常擔(dān)心人工智能技術(shù)的過早部署,可能會產(chǎn)生由于機(jī)器學(xué)習(xí)組件中存在某種錯誤(bug)而導(dǎo)致重大傷亡的情況。像《2001太空漫游》中的HAL 9000一樣,如果我們給予計算機(jī)對重要系統(tǒng)的自主控制權(quán),但隨后又出現(xiàn)了編程錯誤或機(jī)器學(xué)習(xí)故障,計算機(jī)將可能會“接管世界”。我不認(rèn)為計算機(jī)會自發(fā)地“決定”接管世界,那只是一個科幻小說中的故事情節(jié)。我也不認(rèn)為計算機(jī)會“想要變得和我們一樣”,這是另一個至少可以追溯到匹諾曹的故事情節(jié)(也許在中國文化中還有更古老的故事?)。
人類決策可能不如計算機(jī)準(zhǔn)確快速,但是在面對意料之外的情況時,我們更加穩(wěn)健,能夠更好地識別和應(yīng)對計算機(jī)系統(tǒng)中的故障。也正因如此,我認(rèn)為在所有高風(fēng)險決策的過程中,人類都不應(yīng)當(dāng)缺席。
其他
NSR:在美國,已經(jīng)有許多機(jī)器學(xué)習(xí)領(lǐng)域的教授離開高校,進(jìn)入大公司任職。您如何看待這一現(xiàn)象?
迪特里奇:是的,教授加入公司已經(jīng)造成了顯著的“人才流失”(brain drain)。這一現(xiàn)象的產(chǎn)生有幾個原因:首先,在新型人工智能產(chǎn)品的開發(fā)中存在激烈的公司間競爭,所以很多公司會向教授支付非常高的薪水;第二,由于許多機(jī)器學(xué)習(xí)技術(shù)(特別是深度學(xué)習(xí))需要大量的數(shù)據(jù),而公司能夠采集并提供這些數(shù)據(jù),所以在企業(yè)研究“大數(shù)據(jù)”和深度學(xué)習(xí)要比在高校里容易得多;第三,公司還可以購買或開發(fā)用于深度學(xué)習(xí)的專用計算機(jī),如GPU計算機(jī)或谷歌的Tensor處理單元(TPUs)等,這是另一件很難在高校里實現(xiàn)的事情。
這會帶來怎樣的影響呢?主要的影響是,由于從事教學(xué)和科研指導(dǎo)的教授數(shù)量下降,高校能夠訓(xùn)練和培養(yǎng)的人工智能和機(jī)器學(xué)習(xí)領(lǐng)域?qū)W生的數(shù)量下降了。高校訪問大數(shù)據(jù)集和使用專用計算機(jī)的通道也變得狹窄,為解決這一問題,企業(yè)和政府應(yīng)當(dāng)提供更多經(jīng)費(fèi),來幫助高校進(jìn)行數(shù)據(jù)集采集和購買專用計算機(jī)。我不知道政府如何才能解決高校人才流失問題,但它可以幫助解決數(shù)據(jù)和計算方面的問題。
除大數(shù)據(jù)和深度學(xué)習(xí)外,所有其他形式的機(jī)器學(xué)習(xí)(以及上面列出的所有挑戰(zhàn))研究都不難在高校實驗室中開展,例如在俄勒岡州立大學(xué)的實驗室里,我們正在研究異常檢測、強(qiáng)化學(xué)習(xí)和健壯機(jī)器學(xué)習(xí)。
NSR:能否評價一下中國對這一領(lǐng)域的貢獻(xiàn)和影響?你認(rèn)為是否存在某些因素限制了中國研究者能力的發(fā)揮?
迪特里奇:中國科學(xué)家(包括在中國境內(nèi)外工作的)正在為機(jī)器學(xué)習(xí)和人工智能技術(shù)的發(fā)展做出巨大貢獻(xiàn)。中國是語音識別和自然語言翻譯深度學(xué)習(xí)領(lǐng)域的領(lǐng)導(dǎo)者。由于政府和企業(yè)對中國人工智能研究的大量投入,我期待中國研究人員能做出更多的貢獻(xiàn)。我認(rèn)為(阻礙中國研究人員)產(chǎn)生更大影響力的最大障礙就是溝通。大多數(shù)計算機(jī)科學(xué)研究成果都是用英文出版的,而英語對于說普通話的人來說很難學(xué),所以中國科學(xué)家很難(用英語)寫論文或是做具有重大影響的報告。反過來也有同樣的問題。中國現(xiàn)在是人工智能研究的主要陣營(我猜至少占25%)。西方人不懂中文,就很難了解中國的進(jìn)步。我希望語言翻譯技術(shù)的不斷改進(jìn)將有助于減少語言障礙。和溝通有關(guān)的問題還有,中國的網(wǎng)絡(luò)常常難以與世界其他地區(qū)的網(wǎng)絡(luò)相連接,從而使召開電話會議或Skype會議存在困難,這就意味著中國的研究人員常常不會被納入到國際研究項目中去。
NSR:對于進(jìn)入這一領(lǐng)域的年輕研究人員,您有什么建議?
迪特里奇:我的第一個建議是學(xué)生應(yīng)盡可能多地學(xué)習(xí)數(shù)學(xué)。數(shù)學(xué)是機(jī)器學(xué)習(xí)的核心。數(shù)學(xué)很難自學(xué),所以我建議所有學(xué)生都在大學(xué)期間學(xué)習(xí)數(shù)學(xué)。我的第二個建議是盡可能多地閱讀文獻(xiàn),不要只讀深度學(xué)習(xí)的論文,也要閱讀機(jī)器學(xué)習(xí)、人工智能和算法相關(guān)的理論。新的學(xué)習(xí)算法源自對數(shù)學(xué)和優(yōu)化問題結(jié)構(gòu)的深刻理解。不要忘記其他知識分支(如統(tǒng)計、運(yùn)營研究、信息理論、經(jīng)濟(jì)學(xué)、博弈論、科學(xué)哲學(xué)、神經(jīng)科學(xué)、心理學(xué)等)的概念對機(jī)器學(xué)習(xí)和人工智能的發(fā)展一直非常重要。另外,團(tuán)隊合作經(jīng)驗很有價值。現(xiàn)在的大多數(shù)研究都是合作完成的,所以你應(yīng)該練習(xí)團(tuán)隊合作和學(xué)習(xí)解決沖突。最后,培養(yǎng)你的編程和溝通技巧非常重要。你要學(xué)習(xí)編程并掌握最新的軟件工程工具,你還要能寫會說:掌握英語語法和詞匯還遠(yuǎn)遠(yuǎn)不夠,你必須學(xué)會如何在具體的場合里,將你復(fù)雜研究成果的核心觀點清晰地傳達(dá)出來。
作者周志華是南京大學(xué)教授。
原文2017年5月2日首次發(fā)表于《國家科學(xué)評論》,原標(biāo)題為“Machine learning challenges and impact: an interview with Thomas Dietterich”。NSR是科學(xué)出版社旗下期刊,與牛津大學(xué)出版社聯(lián)合出版?!吨R分子》獲授權(quán)刊發(fā)該文中文翻譯。
原文鏈接: https://doi.org/10.1093/nsr/nwx045
制版編輯:艾略特