張崢:中國科研要翻身,須消除“跟風(fēng)”習(xí)氣
?張崢
編者按:
國家千人計劃專家、上海紐約大學(xué)終身教授張崢以“人工智能熱”為例,指出中國科研界的怪現(xiàn)象:“零減”——看似與國際發(fā)達(dá)水平差距為零,但長期依然落后。他認(rèn)為,這一現(xiàn)象源于我們總是處于跟風(fēng)狀態(tài),而不是超前地對待科學(xué)問題。而且這樣的問題,在那些有話語權(quán)的科學(xué)家那里尤其嚴(yán)重。至于創(chuàng)造力旺盛的年輕人在創(chuàng)業(yè)環(huán)境下,不免視線短淺。張崢此文,值得中國科研界警醒。
撰文 | 張崢(國家千人計劃專家,上海紐約大學(xué)終身教授,前微軟亞洲研究院副院長)
責(zé)編 | 李曉明
● ● ●
在不久前召開的全國科技創(chuàng)新大會上,“力爭在重要科技領(lǐng)域?qū)崿F(xiàn)跨越發(fā)展”成為大家關(guān)注的話題。這無疑是中國科技事業(yè)發(fā)展的黃金時期,但是,實現(xiàn)跨越發(fā)展首先必須消除科研界的“零減”現(xiàn)象。
所謂的“零減”,是指我們科技發(fā)展距離國際最發(fā)達(dá)水平也許差距為零,甚至只有刀片厚度的距離,但是從長遠(yuǎn)來看卻是在很長一段時期內(nèi)都會落后。這個站位,不止是目前大熱的人工智能領(lǐng)域,在其它很多研究領(lǐng)域,如果不重視”零減”現(xiàn)象,那么在短期內(nèi)解決這一問題會很難,而且很可能錯失發(fā)展的黃金時期。
1 “零減”現(xiàn)象源于總是在跟風(fēng)
人工智能的井噴狀態(tài)有一個非常重要的非技術(shù)原因:全開放、基本透明的研究方式。很多成果在第一時間發(fā)布在Arxiv.org,公開取用,并附帶開源代碼,不再苦等漫長的會議評審。含金量高的好算法于是迅速在全世界的實驗室遍地開花。同時,“串串燒”也穿透學(xué)科壁壘,以深度網(wǎng)絡(luò)為核心模塊的設(shè)計理念被絕大多數(shù)從業(yè)者采納,某個子領(lǐng)域的創(chuàng)新被“隔壁鄰居”拿來復(fù)用的例子屢見不鮮。在我的印象里,那么多領(lǐng)域的研究人員合力推進(jìn)、更新一個技術(shù),是史無前例的。
這兩個因素加在一起,對技術(shù)前沿推進(jìn)的提速是指數(shù)級別的。所謂水漲船高,國內(nèi)機器學(xué)習(xí)的大熱和這兩個原因息息相關(guān)。可以跟、也容易跟的現(xiàn)狀,造成了虛假繁榮的假象??v觀當(dāng)前的重要結(jié)果,難覓來自中國科研單位對關(guān)鍵性技術(shù)的貢獻(xiàn)。
比如,谷歌阿法狗挑戰(zhàn)人類棋手前后,國內(nèi)立刻出現(xiàn)“我狗更可一戰(zhàn)”的熱鬧景象。4:1大勝之后,谷歌DeepMind團隊卻發(fā)出豪言,要讓阿法狗不依賴人類對局棋譜,從零開始;坊間笑談阿法狗沒法上麻將桌的話音未落,谷歌的同一隊人馬發(fā)出重文,宣布已經(jīng)可以在德州撲克上達(dá)到納什均衡的勝負(fù)水平……
可以跟、也容易跟,是近乎零差距的原因,掩蓋了實力可能正在拉開的真相。跟得越緊也可能越危險,因為關(guān)鍵技術(shù)發(fā)表之前申請專利的動作是不為人知的,很可能早已“請君入甕”而不自知。
2 跟風(fēng)背后的實力真空
讓人更為焦慮的是在硬問題面前的實力真空。從宏觀上來說,造成這種情況有兩個原因。首先,技術(shù)成果的飛速更新帶來知識更新成本的上升。這對同時掌握著對國家科研管理部門的進(jìn)言權(quán)和資源分配的管理權(quán),又為繁重的行政和教學(xué)任務(wù)所累的專家們,是極為嚴(yán)峻的挑戰(zhàn)。我對幾處中國腦計劃的了解是,不同程度上有著無論形散與否都神散的問題。已經(jīng)過了學(xué)習(xí)黃金窗口的專家的知識更新滯后是這個現(xiàn)象的主要根源——要同時保持距離和高度是不可能的。
與此同時,國家迫切希望挖掘技術(shù)紅利的大背景,創(chuàng)業(yè)板熱錢大量涌入的現(xiàn)狀,將絕大多數(shù)年富力強、無論在創(chuàng)新還是學(xué)習(xí)都是黃金階段的中青年技術(shù)骨干裹挾到初創(chuàng)公司。 要面對市場就必須針對用戶腳踏實地,也必然意味著既不能看太遠(yuǎn)也不能看太廣,甚至不能看太新。
一個是跟不動,一個是不能跟。舉槍無準(zhǔn)星,槍中無子彈。問題是,我們在“零減”的軌道上還要滑行多遠(yuǎn)?
3 怎么從跟風(fēng)到領(lǐng)風(fēng)
在現(xiàn)階段不跟不現(xiàn)實:大批優(yōu)秀工作正在涌現(xiàn)之中,不學(xué)習(xí)就談不上超越。但要盡量正確地去跟,而不是去盲目刷分。在學(xué)習(xí)方法的同時更要緊的是琢磨問題是怎么提出的,甚至去想問題背后的母問題是什么。向源頭推進(jìn),向上游走,要耐得住寂寞和艱苦。
跟的時候要找彎道,但不要幻想存在捷徑,幻想短時間內(nèi)有成熟的果子落地。要清楚地認(rèn)識到現(xiàn)在的深度網(wǎng)絡(luò)只是一個階段性成果,在幾年之后一定會遇到瓶頸,把深度網(wǎng)絡(luò)作為組件放到更大的框架是一個更合理的視野(推薦閱讀[1],[2])。在跟的時候不時地抬頭向遠(yuǎn)處。
無論讓深度學(xué)習(xí)在圖像識別上發(fā)力的大數(shù)據(jù)ImageNet,優(yōu)秀的訓(xùn)練平臺如Caffe和MXNet,關(guān)鍵技術(shù)如ResNet,這些站得住腳的重要成果背后都是中國學(xué)者的身影。一個合格的帶路人和有營養(yǎng)、有耐心的環(huán)境是從跟風(fēng)到領(lǐng)風(fēng)的關(guān)鍵。
推薦閱讀
[1] Building Machines that Learn and Think Like People: https://arxiv.org/abs/1604.00289
[2] Towards an Integration of Deep Learning and Neuroscience: http://biorxiv.org/content/early/2016/06/13/058545