預(yù)印本在疫情初期對(duì)全球論述COVID-19傳播能力的影響
● ● ●
《柳葉刀-全球健康》(The Lancet Global Health)近期發(fā)表評(píng)論,分析了此次疫情期間預(yù)印本對(duì)信息傳播的影響。本文分析顯示,因?yàn)槟軌蚣皶r(shí)傳播最新信息,預(yù)印本在公共衛(wèi)生緊急情況下可以發(fā)揮強(qiáng)大作用。預(yù)印本研究對(duì)當(dāng)前COVID-19疫情討論與決策的影響表明:我們必須重新思考,在當(dāng)前和未來(lái)的公共衛(wèi)生緊急情況下,如何獎(jiǎng)勵(lì)和認(rèn)可科學(xué)共同體的貢獻(xiàn)。
自WHO于2020年1月5日首次通報(bào)2019冠狀病毒病(COVID-19)以來(lái),中國(guó)境內(nèi)COVID-19 確診病例已超過80,000例,截至2020年3月6日,疫情已蔓延至全球近90個(gè)國(guó)家[1]。雖然SARS-CoV-2是新發(fā)病毒,但科學(xué)家們已經(jīng)迅速填補(bǔ)了其流行病學(xué)、病毒學(xué)和臨床知識(shí)的空白,僅在1月10日至1月30日期間就進(jìn)行了50多項(xiàng)關(guān)于該病毒的新研究[2]。不過,目前決策者和大眾都期待獲取即時(shí)信息,許多研究率先以未經(jīng)同行評(píng)議的預(yù)印本形式分享出來(lái)。
在過去的三十年里,預(yù)印本服務(wù)器已在科學(xué)出版的生態(tài)系統(tǒng)中十分普遍,但COVID-19似乎將這些平臺(tái)的利用度提高至前所未有的高度[3]。盡管同行評(píng)議對(duì)于科學(xué)驗(yàn)證來(lái)說至關(guān)重要,但當(dāng)前的疫情已經(jīng)顯示了預(yù)印本在緊急事件中傳播信息的速度?;?020年2月1日及之前發(fā)表的有關(guān)評(píng)估SARS-CoV-2傳播潛力(即基本傳染數(shù)[R0])的預(yù)印本和同行評(píng)議研究,本評(píng)論分析了此次疫情期間預(yù)印本對(duì)信息傳播的影響。我們還分析了預(yù)印本和同行評(píng)議研究關(guān)于估算結(jié)果的一致性,并提出了一種基于共識(shí)的方法來(lái)評(píng)估突發(fā)公共衛(wèi)生事件時(shí)期預(yù)印本論文結(jié)果的有效性。為了進(jìn)行分析,我們收集了來(lái)自科學(xué)研究、新聞報(bào)道以及與SARS-CoV-2及基本傳染數(shù)R0相關(guān)搜索趨勢(shì)的公開數(shù)據(jù)。R0是指一個(gè)新病例在完全易感人群中可能引起的繼發(fā)病例平均數(shù),對(duì)R0的估計(jì)可以讓決策者了解特定疫情的流行潛力。
我們分別用MediaCloud和Google Search Trends來(lái)發(fā)掘相關(guān)新聞報(bào)道和搜索趨勢(shì),兩者均作為信息傳播的替代性指標(biāo)。同時(shí),我們還通過谷歌學(xué)術(shù)(Google Scholar)進(jìn)行相關(guān)科學(xué)研究檢索;為了解決索引中可能出現(xiàn)的延遲,還檢索了四個(gè)具有代表性的常用公開預(yù)印本服務(wù)器:arXiv、bioRxiv、medRxiv和SSRN(Social Science Research Network)。附錄(P2)羅列了每個(gè)數(shù)據(jù)源的檢索詞和其他具體信息。通過Google Scholar、arXiv、bioRxiv、medRxiv和SSRN檢索到的所有研究,我們都對(duì)其研究相關(guān)性進(jìn)行了人工篩查,最終只保留了正文中包含SARS-CoV-2 R0估計(jì)值的研究。
最初的數(shù)據(jù)發(fā)掘階段納入了11項(xiàng)獨(dú)立研究,并人工整理了每項(xiàng)研究的首次發(fā)表日期、發(fā)表平臺(tái)、評(píng)議狀態(tài)(預(yù)印本VS同行評(píng)議)和研究方法(附錄P3)[4-18]。我們還從每項(xiàng)研究中提取了R0估計(jì)值以供進(jìn)一步分析。在第一個(gè)版本之后進(jìn)行預(yù)印本修訂或者在單個(gè)研究中使用多種估計(jì)方法都會(huì)產(chǎn)生多個(gè)R0,針對(duì)這種情況,我們對(duì)每個(gè)R0估計(jì)值都做了記錄,并將每個(gè)估計(jì)值都作為一個(gè)單獨(dú)條目來(lái)代表任何給定時(shí)間點(diǎn)的所有可用信息(附錄P3)。由于我們已于1月23日將第一個(gè)已知的R0估計(jì)值發(fā)布到SSRN上,因此我們繪制了1月23日至2月1日期間的搜索趨勢(shì)分?jǐn)?shù)和新聞報(bào)道量曲線圖(附錄P4)。用MediaCloud和Google Search Trends得到的基線數(shù)據(jù)顯示,2020年1月23日之前的搜索興趣和新聞報(bào)道量很少,可忽略不計(jì);而截至2020年2月9日收集的數(shù)據(jù)顯示,峰值過后搜索興趣和報(bào)道量逐漸降低(附錄P4)。為了說明這11項(xiàng)研究的發(fā)布時(shí)間,我們用指示條標(biāo)注了每項(xiàng)研究發(fā)布的日期,并在同一張圖中顯示不同時(shí)間點(diǎn)搜索趨勢(shì)和新聞報(bào)道量的變化(附錄P4)。然后,我們把這11項(xiàng)研究中16個(gè)R0估計(jì)值的相關(guān)信息整理成表格,包括平均值和估計(jì)范圍(如95%置信區(qū)間等)(附錄P3)。R0估計(jì)值是按出版日期和作者姓氏首字母順序排列的,表中同時(shí)包含了預(yù)印本和同行評(píng)議研究的結(jié)果以供比較;還分別計(jì)算了預(yù)印本和同行評(píng)議研究的R0平均值和95%置信區(qū)間(見下文Figure)。


附錄P3
Google Search Trends 和MediaCloud的數(shù)據(jù)顯示,在疫情初期,對(duì)COVID-19 R0的搜索興趣和新聞報(bào)道在相關(guān)同行評(píng)議研究發(fā)表之前就達(dá)到了頂峰。在分析選定的時(shí)間段內(nèi),在 bioRxiv、medRxiv和SSRN發(fā)表了五項(xiàng)預(yù)印本研究(這些研究都估計(jì)了R0)之后,在于1月23日至1月25日搜索興趣激增,并于1月27日達(dá)到峰值。同時(shí),新聞報(bào)道興趣在1月28日達(dá)到峰值,而第六項(xiàng)預(yù)印本研究于同一天在arXiv上發(fā)表(附錄P4)。隨后,Li及其同事于1月29日17:00(東部標(biāo)準(zhǔn)時(shí)間)在The New England Journal of Medicine發(fā)表第一項(xiàng)同行評(píng)議研究。此后至2月1日,Eurosurveillance、The International Journal of Infectious Diseases、《柳葉刀》(The Lancet)和Journal of Clinical Medicine 陸續(xù)發(fā)表另外四項(xiàng)同行評(píng)議研究[14,19]。預(yù)印本研究中的R0平均值為3.61(95% CI:2.77–4.45);同行評(píng)議研究中的R0平均值為2.54(2.17–2.91),雖然組內(nèi)和組間都存在建模方法和數(shù)據(jù)源的差異,但兩組研究(預(yù)印本組和同行評(píng)議組)的95%置信區(qū)間存在重疊(附錄P3)。盡管預(yù)印本研究的R0平均值高于同行評(píng)議組,但這一差距主要是由兩個(gè)上限異常值導(dǎo)致的(R0高于95%置信區(qū)間最大值;見上圖)[9-10]。我們基于95% CI共識(shí)剔除這兩個(gè)估計(jì)值后,預(yù)印本組的R0平均估計(jì)值降到3.02(95% CI:2.65–3.39)。值得注意的是,有兩項(xiàng)同行評(píng)議研究之前已作為預(yù)印本發(fā)布[15-16]。盡管Riou和Althaus提出的R0估計(jì)值在同行評(píng)議后仍保持不變,但Zhao及其同事在預(yù)印本研究中提出的R0估計(jì)值要高于同行評(píng)議后的R0估計(jì)值。
附錄P4
我們的分析結(jié)果表明,由于預(yù)印本論文的發(fā)布要快于同一主題領(lǐng)域中同行評(píng)議研究的發(fā)表,因此預(yù)印本可能正在推動(dòng)此次COVID-19疫情中的相關(guān)討論。雖然本文的分析側(cè)重于搜索趨勢(shì)和新聞媒體數(shù)據(jù),并以此作為衡量公眾討論的指標(biāo),但由于WHO在2020年1月26日宣布創(chuàng)建一個(gè)COVID-19相關(guān)研究的資料庫(kù),包含那些未經(jīng)過同行評(píng)議的論文,因此預(yù)印本可能也在影響著決策討論[20]。
雖然預(yù)印本能夠快速傳播信息有其特有的優(yōu)勢(shì),但缺乏同行評(píng)議確實(shí)可能會(huì)有意或無(wú)意地導(dǎo)致研究缺乏可信度和信息錯(cuò)誤等問題。這一嚴(yán)重弊端在當(dāng)前疫情期間尤為突出,特別是一項(xiàng)病毒學(xué)研究從預(yù)印本服務(wù)器bioRxiv上高調(diào)撤稿之后。該研究曾錯(cuò)誤的聲稱COVID-19致病病毒中含有艾滋病毒插入片段[21] 。這個(gè)預(yù)印本論文撤稿的事實(shí)恰恰顯示了緊急事件期間公開同行評(píng)議的力量。被撤回的文章似乎受到來(lái)自全球數(shù)十名科學(xué)家的強(qiáng)烈抗議,因該文章發(fā)布在一個(gè)公開的服務(wù)器上,所以這些科學(xué)家都能看到這項(xiàng)研究[22]??茖W(xué)家們大多是通過推特發(fā)表短評(píng)和博客發(fā)表長(zhǎng)評(píng)來(lái)發(fā)聲抗議的,這說明,將來(lái)研究預(yù)印本對(duì)公共討論的影響時(shí),這些論壇和平臺(tái)可以提供豐富的額外數(shù)據(jù)來(lái)源[22]。然而,此類事件表明,使用任何預(yù)印本研究的結(jié)果指導(dǎo)實(shí)踐時(shí)需要謹(jǐn)慎。
考慮到這一點(diǎn),本文中呈現(xiàn)出的多項(xiàng)研究綜合分析,有助于保證謹(jǐn)慎對(duì)待預(yù)印本研究的結(jié)果,同時(shí)可以在同一主題領(lǐng)域的同行評(píng)議研究發(fā)表前獲取重要和強(qiáng)有力的見解。本文使用了一種簡(jiǎn)單的方法,匯總了1月29日第一個(gè)同行評(píng)議研究發(fā)表之前的預(yù)印本中包含的10個(gè)R0估計(jì)值;然后取這些R0估計(jì)值的平均值,并依據(jù)人工分析和95%置信區(qū)間剔除兩個(gè)上限異常值。即使在剔除異常值之前,這種方法得出的R0平均值也非常接近1月29日及之后發(fā)表的同行評(píng)議研究中的R0估計(jì)值。不過,未來(lái)的研究可以采取依據(jù)置信區(qū)間計(jì)算加權(quán)平均數(shù)這種更復(fù)雜的方式,類似傳統(tǒng)的Meta分析方法。在進(jìn)行定量分析時(shí),這種基于共識(shí)的總體分析方法可能是最簡(jiǎn)單的;而許多影響決策的流行病學(xué)重要參數(shù)(如潛伏期、世代時(shí)間等)都是定量的,本文提出的方法可推廣至這類研究。
本文分析顯示,因?yàn)槟軌蚣皶r(shí)傳播最新信息,預(yù)印本在公共衛(wèi)生緊急情況下可以發(fā)揮強(qiáng)大作用。此外,本分析中包含的兩個(gè)預(yù)印本研究之后發(fā)表在了同行評(píng)議期刊上,這表明,即使是聲譽(yù)很高的期刊現(xiàn)在也允許在同行評(píng)議之前分享重要的研究發(fā)現(xiàn),而且預(yù)印本平臺(tái)的使用不會(huì)影響之后研究在同行評(píng)議期刊上的發(fā)表[15-16]。毫無(wú)疑問,關(guān)鍵作者排序和同行評(píng)議出版物無(wú)疑是個(gè)人職業(yè)發(fā)展(如學(xué)術(shù)晉升)的重要指標(biāo);然而,預(yù)印本研究對(duì)當(dāng)前COVID-19疫情討論與決策的影響表明:我們必須重新思考,在當(dāng)前和未來(lái)的公共衛(wèi)生緊急情況下,如何獎(jiǎng)勵(lì)和認(rèn)可科學(xué)共同體的貢獻(xiàn)。
*中文翻譯僅供參考,一切內(nèi)容以英文原文為準(zhǔn)。
注:本文轉(zhuǎn)載自柳葉刀TheLancet。