張?jiān)录t (浙大學(xué)報(bào)前總編輯)
2010年9月,我在《自然》發(fā)文,指出文字查重工具 CrossRef 發(fā)現(xiàn)投到《浙江大學(xué)學(xué)報(bào)》(英文版)31% 的論文投稿可能存在抄襲現(xiàn)象。10年過去了,文字重復(fù)出版問題確有了改善。孰不知圖像不端的風(fēng)波正在一浪高似一浪。
7月21日,《自然》發(fā)文大談AI技術(shù)能助 “專打圖像之假的斗士” Bik博士對(duì)論文圖像查重。Bik博士這兩年全靠肉眼打假,發(fā)現(xiàn)論文中的圖像不端問題而聞名,讓一批 “研究論文中發(fā)現(xiàn)重復(fù)的圖像” 的學(xué)術(shù)造假者瑟瑟發(fā)抖。
看到如今為查處科研不端如此研發(fā)工具,竟然用到人工智能,不由得想問有誰計(jì)算過查處科研誠信的成本有多高?科研不端的的后果會(huì)如何?記得美國10年前為學(xué)術(shù)不端的調(diào)查/研究投入經(jīng)費(fèi)達(dá)1億1千萬美元;那時(shí)也有人計(jì)算過查處學(xué)術(shù)不端行為的成本和未得到充分認(rèn)識(shí)的后果,分析后得出四點(diǎn)結(jié)論
(https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1000318 )
1. 科學(xué)不端行為造成的不良后果是廣泛的,與調(diào)查相關(guān)的費(fèi)用是巨大的;2. 調(diào)查科學(xué)不當(dāng)行為的單個(gè)案件的直接和間接成本是可以估算的;3. 對(duì)一項(xiàng)特定的調(diào)查,其在評(píng)審過程中所有階段均有成本估算,直接成本估算525,000美元;4. 對(duì)國家而言向科研誠信辦公室報(bào)告和未報(bào)告的所有科學(xué)不當(dāng)行為案件的審核,相關(guān)總費(fèi)用可能成倍增加;我們可曾計(jì)算過5年前韓春雨事件,有多少專業(yè)人士為了證明其結(jié)果的可重復(fù)性做了多少實(shí)驗(yàn)?國家與學(xué)校為他 “假陽性” 的行為付出了多少經(jīng)費(fèi)?這些成本難道不需要計(jì)算嗎?坦率地說,全世界都是一樣,視科學(xué)與科學(xué)期刊為真理的殿堂,而誠信是前提。學(xué)術(shù)期刊對(duì)所有作者的投稿發(fā)表,不妨借用一個(gè)法律概念“無罪定論”,絕對(duì)不會(huì)懷疑作者有假而來,持包容信任的態(tài)度,尤其是未經(jīng)證實(shí)和判決有學(xué)術(shù)造假之前。但是今天的精英層,尤其是一直被國際同業(yè)認(rèn)為勤奮的頂尖中國科研人員,接連被查出發(fā)表的論文圖片有假,無論你無意重復(fù)用圖,有意編造做假,已經(jīng)深深地傷害了中國科研人員的聲譽(yù),玷污了科學(xué)的可靠性和完整性。若國際期刊對(duì)中國作者的來稿首先放棄了 “無罪定論” 的慨念,統(tǒng)統(tǒng)來查是否有不端現(xiàn)象,這不僅增加了中國科技文章發(fā)表的難度,也會(huì)因疑有假而不引用中國研究論文的成果,無形中等于關(guān)閉了中國科技與外界的交流平臺(tái),試問:其后果與代價(jià)誰去研究計(jì)算過?
面對(duì)接連不斷的中國作者涉嫌圖片重復(fù)或造假的地震波,特邀請(qǐng)生物醫(yī)學(xué)領(lǐng)域期刊的主編夏華向教授的團(tuán)隊(duì)對(duì)圖片學(xué)術(shù)不端的幾種類型,與圖片學(xué)術(shù)不端可能產(chǎn)生的原因與后果做一些專業(yè)分析,并將國際學(xué)術(shù)出版對(duì)圖片發(fā)表的規(guī)則與標(biāo)準(zhǔn)做一些解讀。
撰文 | 廖慶姣(美捷登生物科技有限公司學(xué)術(shù)部主任)
夏華向(Journal of Clinical and Translational Hepatology 主編)
2020年7月5日,微生物學(xué)家、影像分析專家,被譽(yù)為 “造假偵探” 的比克(Elisabeth Bik)博士在自己的博客《科學(xué)誠信文摘》(Science Integrity Digest)上發(fā)文,揭示在英文期刊發(fā)表的121篇來自中國作者的科研論文似乎存在不當(dāng)圖片重復(fù)使用。同時(shí)公布了這121篇論文的作者名單及其單位。一石激起千層浪,這篇博文引起了國內(nèi)外媒體的高度關(guān)注。2020年7月5日,《華爾街日?qǐng)?bào)》發(fā)表了題為 Red Flags Raised Over Chinese Research Published in Global Journals 的英文評(píng)論文章,在7月7號(hào)還刊發(fā)了對(duì)應(yīng)的中文版,報(bào)道了對(duì)刊發(fā)文章的雜志社和作者進(jìn)一步跟蹤追蹤情況,同時(shí)分析了背后可能的原因并強(qiáng)調(diào)說明中國政府已經(jīng)注意到這一問題并開始采取了一些措施。7月11日《搜狐》刊登了題為“再曝121篇論文造假,這本3分SCI期刊怕是要涼涼!華爾街日?qǐng)?bào)質(zhì)疑中國學(xué)術(shù)誠信”報(bào)道評(píng)論文章,很多知名微信公眾號(hào)也刊登了類似報(bào)道評(píng)論。實(shí)際上,論文圖片問題已經(jīng)成為學(xué)術(shù)造假的重災(zāi)區(qū)。2018年10月,比克和同事在《分子和細(xì)胞生物學(xué)》(Molecular and Cellular Biology)發(fā)表的一項(xiàng)研究發(fā)現(xiàn),2009-2016年間發(fā)表在該期刊的960篇論文中,有59篇(6.1%)存在不當(dāng)圖片重復(fù)使用(Inappropriate image duplication),其中,41篇更正,5篇撤稿,13篇沒有采取行動(dòng)。他們推測,同期在 PubMed 數(shù)據(jù)庫發(fā)表的論文大約有3.5萬篇論文存在嚴(yán)重的不當(dāng)圖片重復(fù)使用而需要撤稿。論文圖片作假(包括不當(dāng)圖片重復(fù)使用)一旦被揭發(fā),很可能斷送當(dāng)事人的科研、學(xué)術(shù)生涯。而隨著科技高速發(fā)展,各種 “查重”、“打假” 軟件的產(chǎn)生,各種學(xué)術(shù)不端行為必將被檢查出來。科研人員一定要遵守科研倫理和學(xué)術(shù)誠信,不要在科研論文中弄虛作假,尤其不要心存僥幸在論文圖片上作假。下面,我們將從專業(yè)視角通過案例分析圖片作假包括不當(dāng)圖片重復(fù)使用的形式及可能的后果,并簡要介紹科研圖片處理應(yīng)該遵循的原則。1) 一圖一文重復(fù)使用:即在同一篇文章中有完全相同的圖片(例如免疫印跡條帶或細(xì)胞免疫熒光照片),但表示不同的處理結(jié)果;或同一文章中將一張圖片經(jīng)過不同剪切拼接后,表示不同的處理結(jié)果。對(duì)于完全相同的圖片這種情況,雜志社一般比較寬容,發(fā)現(xiàn)后一般是要作者解釋并提供原片以及正確的圖片,畢竟有時(shí)候圖片太多了拼圖時(shí)也可能發(fā)生錯(cuò)誤,只要能提供正確的圖片并且提供所有的原片,雜志社一般不會(huì)深究。對(duì)于圖片經(jīng)過一定剪切拼接這種情況,因?yàn)槭?“有意” 所為,會(huì)被認(rèn)為存在圖片作假行為,因此存在被撤稿的風(fēng)險(xiǎn)。圖1展示了一種比較典型的這種情況,上圖中Distal組+/+(紅色框)和下圖中Proximal組-/-(紅色框)完全相同,兩張圖片應(yīng)該都是同一張圖片的一部分;黃色線框示意的是完全相同的圖片表示不同的處理結(jié)果。圖1. 一圖一文重復(fù)使用示例。相關(guān)文章已被撤稿
圖片根據(jù)Retraction Watch網(wǎng)站上的撤稿說明(http://retractionwatch.com/2017/11/07/researchers-ask-retract-cancer-paper-five-days-flagged-journal)制作,原圖來自已撤稿文章https://jcs.biologists.org/content/130/4/805.long
2) 一圖多文重復(fù)使用:相同的圖片在不同的文章中重復(fù)使用。這種是目前發(fā)現(xiàn)比較多的一種不當(dāng)圖片重復(fù)形式,是比較公認(rèn)的一種學(xué)術(shù)不端行為。因此,這種情況一旦被雜志社發(fā)現(xiàn),都將被撤稿。被Journal of General Virology雜志發(fā)表關(guān)注聲明的Gulam Waris博士圖片作假主要是這種情況。目前已經(jīng)被撤稿的9篇全部是因?yàn)橐粓D多文重復(fù)使用(圖2)。圖2. 以“Gulam Waris”為關(guān)鍵詞在Retraction Watch (撤稿觀察)數(shù)據(jù)庫(http://retractiondatabase.org)的檢索結(jié)果(http://retractiondatabase.org/RetractionSearch.aspx#?auth%3dGulam%2bWaris)
圖3展示的是 Gulam Waris 博士于2012年發(fā)表在 Journal of General Virology 雜志的一篇文章中圖3c中 Actin 條帶是其2003年發(fā)表在 Journal of Biology Chemistry 雜志的一篇文章中圖2A中Actin的一部分。圖3. 一圖多文重復(fù)使用示例一。相關(guān)文章已被撤稿
引自PubPeer網(wǎng)站:https://pubpeer.com/publications/74D279D33833580DCF3FA1FC9CF893
同樣,Gulam Waris博士2010年發(fā)表在 Journal of General Virology 雜志上的一篇文章也與其2003年發(fā)表在 Journal of Biology Chemistry 雜志上的這篇文章有多個(gè)條帶重復(fù)(圖3),相同顏色的框示意條帶相同。
圖4. 一圖多文重復(fù)使用示例二,相關(guān)文章已被撤稿引自PubPeer網(wǎng)站:https://pubpeer.com/publications/6602D5F5A612F1B5BEE632996A2A66
02
圖片作假常用軟件
圖片作假過程中常用的軟件是 Photoshop(PS)。前面舉例算是比較簡單的一些PS操作,只是裁剪。實(shí)際上很多作者為了達(dá)到 “預(yù)期結(jié)果” 會(huì)用PS對(duì)圖片做更多處理,或移位或旋轉(zhuǎn),展示為不同的結(jié)果;或拼接不同的圖片,或清除背景,展示對(duì)結(jié)果有利的圖片;有少數(shù)作者為追求 “結(jié)果完美” 也會(huì) “無意” 做一些PS修改。根據(jù)比克博士的調(diào)查,已存在一家或數(shù)家 “論文工廠” 用PS進(jìn)行批量作假。Journal of Biological Chemistry 上2002年發(fā)表的一篇文章,后來被揭發(fā)存在圖片作假,這篇文章涵蓋了圖片作假中免疫印跡常用的各種PS技術(shù),在2018年已經(jīng)被撤稿(圖5)。圖5. 被撤文章及撤稿聲明
圖片來自https://pubmed.ncbi.nlm.nih.gov/30030385/
這篇文章的 Figure 2A 和 Figure 3A 存在大量條帶被重復(fù)使用情況。如圖6所示,F(xiàn)igure 2A 中的p-ERK條帶完全是兩個(gè)條帶復(fù)制而來,而 Figure 3A 中的 GST-RBD 條帶也完全是一個(gè)條帶的重復(fù);其他相同顏色的框示意相同的條帶。圖6. 圖片PS示例一。相關(guān)文章已被撤稿
引自PubPeer網(wǎng)站:https://pubpeer.com/publications/89582C2164A1D9F4764540B7A83E2B
甚至通過PS技術(shù),作者還能根據(jù)一點(diǎn) “素材” 完全 “創(chuàng)造” 出一個(gè)完整的實(shí)驗(yàn)結(jié)果。圖7就是這樣被“創(chuàng)造”出來的。咋一看,感覺只有右下角的兩個(gè)條帶和上面有點(diǎn)一樣的感覺,但實(shí)際上,整個(gè)結(jié)果是作者通過對(duì)同一段條帶的不同部分進(jìn)行不同的亮度調(diào)整,以及各種剪切拼接,最后拼合出三個(gè)條帶。圖7. 圖片PS示例二。相關(guān)文章已被撤稿。
引自PubPeer網(wǎng)站:https://pubpeer.com/publications/89582C2164A1D9F4764540B7A83E2B
圖8展示了這一PS操作拼接過程,同一段條帶經(jīng)過5次不同亮度的調(diào)整,然后裁剪不同的條帶進(jìn)行拼接,最終得到如圖7顯示的三段結(jié)果條帶。圖9以另一種方式展示了這一拼接過程,相同顏色的框示意最終相應(yīng)段條帶的原始素材來源。圖8. 圖7中圖片具體PS過程還原。相關(guān)文章已被撤稿。
引自PubPeer網(wǎng)站:https://pubpeer.com/publications/89582C2164A1D9F4764540B7A83E2B
圖9. 示意圖7中具體PS的各條帶段。相關(guān)文章已被撤稿。
引自PubPeer網(wǎng)站:https://pubpeer.com/publications/89582C2164A1D9F4764540B7A83E2B
比克博士在2020年7月5日揭露的疑是中國“論文工廠”發(fā)表的文章,絕大多數(shù)都是用PS處理圖片達(dá)到一圖多文重復(fù)使用。圖10是比克博士總結(jié)發(fā)現(xiàn)的兩個(gè)劃痕實(shí)驗(yàn)的 “種子” 圖片示意圖,圖11是9個(gè)相關(guān)分析 “種子” 圖片示意圖,每張 “種子” 圖片通過PS進(jìn)行不同的處理,最終生成多張用于不同文章中的結(jié)果圖片。圖10. 劃痕實(shí)驗(yàn)的兩個(gè)“種子”圖片示意圖(WH01和WH02)
引自https://scienceintegritydigest.com/2020/07/05/the-stock-photo-paper-mill/#comment-form-load-service:Twitter
圖11. 相關(guān)分析9個(gè)“種子”圖片示意圖(Up1-5和Down1-4)
引自https://scienceintegritydigest.com/2020/07/05/the-stock-photo-paper-mill/#comment-form-load-service:Twitter
03
科研圖片處理應(yīng)該遵循的規(guī)則
圖片作假被發(fā)現(xiàn)后通常都會(huì)受到撤稿的處罰,而且這種原因的撤稿對(duì)科研工作者的學(xué)術(shù)生涯是一個(gè)巨大的污點(diǎn)和嚴(yán)重?fù)p害。隨著現(xiàn)在各種技術(shù)軟件越來越多,圖片作假幾乎已經(jīng)無所遁形,幾乎百分之百會(huì)被發(fā)現(xiàn)。一旦被發(fā)現(xiàn)后撤稿,很可能斷送科研生涯。科研圖片處理應(yīng)該遵循什么樣的原則呢?2012年美國科學(xué)編輯委員會(huì)(Council of Science Editors,CSE)在 CSE’s White Paper on Promoting Integrity in Scientific Journal Publications, 2012 Update(《推動(dòng)科技期刊出版誠信的白皮書》)建議了最開始由洛克菲勒大學(xué)出版社提出、后來被不斷修改完善的四項(xiàng)基本原則:
(https://www.councilscienceeditors.org/resource-library/editorial-policies/white-paper-on-publication-ethics/3-4-digital-images-and-misconduct/#341):
a) No specific feature within an image may be enhanced, obscured, moved, removed, or introduced. (不要對(duì)一張圖片的局部區(qū)域進(jìn)行增強(qiáng)、模糊、移動(dòng)、移除或插入新內(nèi)容等操作。)
b) Adjustments of brightness, contrast, or color balance are acceptable if they are applied to the whole image and as long as they do not obscure, eliminate, or misrepresent any information present in the original. (可對(duì)整張圖片的亮度、對(duì)比度或色彩平衡進(jìn)行調(diào)整,不能隱藏、消除或歪曲原圖的信息。)
c) The grouping of images from different parts of the same gel, or from different gels, fields, or exposures must be made explicit by the arrangement of the figure (e.g., dividing lines) and in the text of the figure legend. (允許從同一凝膠上不同部位,或從不同的凝膠、區(qū)域、曝光區(qū)取得圖像并進(jìn)行圖片拼合,但須使用明確的分割線表示它們來自不同的原圖,并在圖注中予以說明。)
d) If the original data cannot be produced by an author when asked to provide it, acceptance of the manuscript may be revoked. (如作者不能提供原始數(shù)據(jù),文章將被拒稿或撤稿。)希望以上內(nèi)容能讓大家對(duì)圖片做假有一個(gè)比較清晰的認(rèn)識(shí),在實(shí)際工作過程中嚴(yán)格按照CSE建議的原則進(jìn)行處理,避免 “踩雷”。最近來自紐約雪城大學(xué)的機(jī)器學(xué)習(xí)研究人員Daniel Acuna開發(fā)了一款論文圖像查重軟件。Nature雜志在2020年7月21日對(duì)此發(fā)表了題為 “ Pioneering duplication detector trawls thousands of coronavirus preprints ”的報(bào)道。也許在不久的將來,雜志社除了對(duì)論文文稿進(jìn)行常規(guī)查重以避免抄襲外,也將對(duì)圖像進(jìn)行查重以避免圖片作假。愿大家:誠信做科研,真實(shí)發(fā)論文!