IBM腫瘤醫(yī)生“沃森”被曝不好用,醫(yī)療AI前景堪憂?
?韓國第一位接受沃森腫瘤輔助治療的癌癥患者,正和嘉川大學吉醫(yī)學中心的腫瘤專家一起瀏覽自己的疾病信息。來源:嘉川大學吉醫(yī)學中心
編者按:
最近,IBM公司用于輔助醫(yī)生設計癌癥治療方案的AI產(chǎn)品沃森被曝出諸多問題,包括可能開出危險和錯誤的癌癥治療方案。這會對醫(yī)療AI行業(yè)產(chǎn)生什么樣的影響?從事醫(yī)療AI研究或產(chǎn)業(yè)化的幾位專家表達了他們的看法。
撰文 | 蔣海宇
責編 | 陳曉雪
● ● ●
“這個產(chǎn)品非常糟糕。我們當時為了醫(yī)院推廣購買這個產(chǎn)品,希望它能實現(xiàn)IBM宣稱的愿景。結(jié)果大多數(shù)情況下,它根本沒用。”美國佛羅里達朱皮特醫(yī)療中心(Jupiter Medical Center)的一名醫(yī)生,當著IBM高管的面,這樣評價他們的沃森腫瘤(Watson for Oncology)。
對,就是那個曾被看好,也激起許多爭議的醫(yī)療輔助人工智能系統(tǒng)沃森。沃森腫瘤的使用非常簡單:只需將患者個人信息(比如病歷、成像報告等)輸入系統(tǒng),系統(tǒng)便基于大量的醫(yī)學研究、醫(yī)學指南、臨床試驗等信息,推薦合適的治療方案,供醫(yī)生參考。
7月25日,美國健康醫(yī)療媒體STAT曝出,IBM公司的內(nèi)部文件顯示,用于輔助醫(yī)生設計癌癥治療方案的AI產(chǎn)品沃森問題不?。撼松厦婺欠N來自用戶的抱怨,還會開出危險和錯誤的癌癥治療方案。
沃森腫瘤是IBM在醫(yī)療人工智能領域的重要產(chǎn)品,能夠根據(jù)患者病歷等信息提供包括乳腺癌、肺癌、直腸癌、結(jié)腸癌等多種癌癥的治療方案,合作者有紀念斯隆-凱特琳癌癥中心 (Memorial Sloan Kettering Cancer Center)、梅奧醫(yī)院(Mayo Clinic)、奎斯特診斷公司(Quest Diagnostics)等醫(yī)療領域的著名機構(gòu)。根據(jù)其中國代理公司官網(wǎng),國內(nèi)已經(jīng)有20多個省的近80家醫(yī)院引進沃森腫瘤會診中心。
IBM”家丑”被泄
STAT收到的內(nèi)部文件,是時任IBM 沃森醫(yī)療部門執(zhí)行健康官(Health’s deputy chief health officer)Andrew Norden于2017年夏天,在公司內(nèi)部報告上用的幻燈片。
據(jù)STAT的報道,IBM在這份報告里,對沃森的批評毫不留情,要點包括:
△沃森系統(tǒng)的訓練,使用的不是真實患者的數(shù)據(jù),而是假想患者的假想數(shù)據(jù)。
△訓練數(shù)據(jù)不夠。幻燈片展示了八種癌癥。截至報告發(fā)布當天,訓練數(shù)據(jù)量最高的肺癌只有635例,而最低的卵巢癌只有106例。
△訓練沃森時,對假想患者推薦的治療方案,是基于紀念斯隆-凱特琳癌癥中心專家的方案,而非醫(yī)療指南或真實證據(jù)。
△在對假想情形進行試驗時,沃森開出了不合適且危險的治療方案。比如,它為一個顯示有可能正嚴重出血的肺癌患者,推薦同時使用化療和安維汀。然而,安維汀可能引起嚴重的出血,不應推薦給已經(jīng)出血的患者。
△用來評估沃森系統(tǒng)和癌癥專家間方案相似性的實驗,可能有偏向性,使兩種方案很容易相同。
人工智能公司 Nara Logics的CEO Jana Eggers在接受STAT采訪時指出,沃森系統(tǒng)顯然沒有使用醫(yī)療系統(tǒng)中的大數(shù)據(jù),“我搞不懂,明明有真人的真實數(shù)據(jù),為什么他們還要生造出一堆幻想的病人出來?”
一些專家認為,如果這些假想數(shù)據(jù)對真實患者狀況有代表性,也能很好地訓練沃森。不過,“我們還需要看到數(shù)據(jù)有代表性的證據(jù)”,斯坦福大學生物信息研究中心副教授Jonathan Chen說。
事實上,對沃森的質(zhì)疑從未斷過。早在去年2017年,STAT就發(fā)表過一份對沃森醫(yī)療人工智能系統(tǒng)的調(diào)查,對上述問題都有提及。原IBM 沃森研究中心的Claudia Perlich教授,在2017年接受美國科技媒體Gizmodo采訪時,更直言沃森醫(yī)療是“小兒科”,“我們數(shù)據(jù)科學共同體的認知是,沃森能做的,你都應該可能找到免費軟件來實現(xiàn),或者自己做一個?!?/p>
此次的內(nèi)部文件,更多是暴露了IBM自身對沃森局限性的認知。
今年5月,IBM對其沃森醫(yī)療部門進行裁員。IBM發(fā)言人Ian Colley告訴電氣電子工程師學會(IEEE),只有少量沃森醫(yī)療部門工作人員被裁掉,裁員也只是部門精簡的一部分。然而,被裁掉的一名工程師透露,大約有80%的員工被迫離職?!半x職的都是重要技術人員,以及和客戶面對面打交道的人,可不是無關緊要的行政人員。”這名工程師說。
推薦治療并非主流
人工智能在醫(yī)療中有很多應用場景,包括醫(yī)學影像、基因組信息處理、藥物研發(fā)、健康數(shù)據(jù)管理、導診機器人等等。臨床診療方面的應用對現(xiàn)有醫(yī)療實踐影響最顯著,所以最受關注。沃森腫瘤這種試圖根據(jù)患者信息,推薦治療方案的應用,只是其中一種,也不是主流。
目前在臨床方面,醫(yī)療人工智能多與醫(yī)學影像相關,著重在為醫(yī)生提供各式工具,或優(yōu)化已有影像工具,以幫助他們診斷或治療。
比如,人工智能診斷工具可以從醫(yī)學影像中識別人眼看不見,或者容易看漏的病灶。在這方面,根據(jù)CT影像識別肺結(jié)節(jié)篩查肺癌,是目前最常見的應用之一。
?利用機器學習,識別肺結(jié)節(jié)。圖片來源:Vatsal Sodha, Medium
也有團隊在用機器學習提升醫(yī)學影像的成像速度和質(zhì)量。照過X光片的人,可能記得,醫(yī)生會讓病人屏住呼吸。這樣做的目的,是為了防止呼吸運動影響成像。X光成像只需幾秒鐘,但正電子發(fā)射計算機斷層掃描(PET)通常要進行十幾分鐘,就不是屏住呼吸能解決的了。目前很多研究團隊,通過自動門控技術,修復呼吸對PET成像的影響。

?原始PET成像(a)和使用自動門控技術糾偏過的PET成像(b),(b)圖的偽影更少了。圖片來源:Walker et al. 2018。
人工智能也可將2D影像變成3D影像,幫助外科醫(yī)生進行手術。清華大學廖洪恩教授帶領的微創(chuàng)診療與三維影像實驗室,將醫(yī)學圖像智能化分析運用在血管內(nèi)介入手術,讓醫(yī)生能看見手術導管在血管里的具體位置。他們的評估顯示,影像中導管形狀與實際導管的誤差僅為2.23 ± 0.87 毫米(Chen et al. 2017)。目前該研究還在進行動物實驗。除此之外,他們還將該技術用于骨科移植,讓醫(yī)生能看見患者股骨的三維形態(tài),幫助醫(yī)生匹配合適的植入物。
?血管內(nèi)介入手術示意圖
(來源:Capture Vascular, YouTube)
還有一些應用,中國科學院自動化研究所研究員田捷告訴《知識分子》,是通過人工智能幫助患者避免不必要的手術。外科大夫在為結(jié)直腸癌病患做手術前,會為患者做一個輔助化療,以控制癌癥的發(fā)展,之后再進行手術。一部分病患在輔助化療以后,病情已經(jīng)完全緩解,但醫(yī)生無法判斷患者體內(nèi)是否還有癌細胞。田捷介紹,他所在研究所和北大腫瘤醫(yī)院的合作研究,通過分析醫(yī)療影像,有90%的把握把那些已經(jīng)緩解的患者篩選出來,免受開刀。
北美放射醫(yī)學大會這樣描述未來的醫(yī)學影像中心:“醫(yī)學影像中心就像飛機駕駛艙一樣,是各種各樣信息的綜合體;而未來的醫(yī)生則相當于飛行員,要處理各種各樣的信息”。田捷很贊同這個說法,并補充道,“在我看來,AI不會替代醫(yī)生,只會更有效地輔助醫(yī)生。而醫(yī)生也不應懼怕新興技術,而是積極地去利用它,使用它?!?/p>
醫(yī)療人工智能商業(yè)前景不明
從實驗室里的人工智能研究,到實驗室外的商業(yè)化產(chǎn)品,過程并不簡單。億歐智庫的一項統(tǒng)計顯示,11家千萬級以上的醫(yī)療人工智能企業(yè)中,有7家都與醫(yī)療影像相關?,F(xiàn)在已經(jīng)有多家公司進駐各大三甲醫(yī)院。這些產(chǎn)品主要利用目標識別,針對某個疾病,輔助診斷疾病。
由于目前的人工智能產(chǎn)品都只針對單項任務,對醫(yī)生的幫助有待觀察。比如,騰訊覓影針對肺部的影像,識別肺結(jié)節(jié)。“醫(yī)生看片時不只找出結(jié)節(jié),還需對結(jié)節(jié)定性。另外,我們肺里還有其他病變,比如:還可能有梗塞,可能還有支氣管擴張,還有肺的纖維化等?!睆V東省人民醫(yī)院影像醫(yī)學部主任兼放射科主任梁長虹指出,“如果系統(tǒng)能把五、六種常見病的查找結(jié)合在一起,那將滿足胸片閱讀工作90%以上,才基本上能說幫助到我們醫(yī)生,減輕我們的負擔?!?/p>
談到此次沃森腫瘤問題被曝,東軟醫(yī)療首席科學家黃峰認為,IBM的問題不會影響到中國的相關產(chǎn)業(yè)?!叭斯ぶ悄艿淖饔檬嵌喾矫娴?,IBM選擇了風險最大的應用。國內(nèi)企業(yè)要務實的多?!秉S峰說。
目前來看,醫(yī)療人工智能的商業(yè)前景還不明朗。“我認為他們現(xiàn)在還缺乏比較好的商業(yè)模式,基本都沒有產(chǎn)生盈利,基本上還在探索商業(yè)模式及利用數(shù)據(jù)完善產(chǎn)品?!绷洪L虹說,“現(xiàn)在基本上是把系統(tǒng)給到醫(yī)院,利用醫(yī)院的現(xiàn)有數(shù)據(jù),對系統(tǒng)進行訓練?!痹谶@個意義上,目前人工智能對醫(yī)院數(shù)據(jù)的依賴,要大于醫(yī)院對人工智能系統(tǒng)的需求。
“人工智能輔助診療系統(tǒng)尚未獲批正式用于臨床。用于臨床之前,它們需要通過藥監(jiān)局的安全性和有效性的審批。而目前為止,沒有任何一個系統(tǒng)得到審批?!碧锝菡f。
參考文獻:
1. IBM’s Watson supercomputer recommended ‘unsafe and incorrect’ cancer treatments, internal documents show, STAT, https://www.statnews.com/2018/07/25/ibm-watson-recommended-unsafe-incorrect-treatments/
2. Layoffs at Watson Health Reveal IBM’s Problem With AI, IEEE, https://spectrum.ieee.org/the-human-os/robotics/artificial-intelligence/layoffs-at-watson-health-reveal-ibms-problem-with-ai
3. Why Everyone Is Hating on IBM Watson—Including the People Who Helped Make It, Gizmodo, https://gizmodo.com/why-everyone-is-hating-on-watson-including-the-people-w-1797510888
4. Chen, Fang, Jia Liu, and Hongen Liao. "3D Catheter Shape Determination for Endovascular Navigation Using a Two-Step Particle Filter and Ultrasound Scanning." IEEE transactions on medical imaging 36, no. 3 (2017): 685-695.
5. Walker, Matthew D., Kevin M. Bradley, and Daniel R. McGowan. "Evaluation of principal component analysis-based data-driven respiratory gating for positron emission tomography." The British journal of radiology 91, no. 1085 (2018): 20170793.
6.《2018中國醫(yī)療人工智能發(fā)展研究報告》,億歐智庫,2018
制版編輯 | 皮皮魚