實(shí)驗(yàn)的設(shè)計(jì) | 科學(xué)研究的方法(三)
圖片來自Pixabay
編者按:
做科學(xué)研究,首先要學(xué)習(xí)做研究工作的方法。所謂 “工欲善,必先利其器”,這句話就是講改進(jìn)和完善自己工作方法的重要性。
作者蔣百川博士后期間,因教授Flom “世界上有多少事沒人做過,你做得過來嗎?這不能成為你要做這個(gè)研究的理由”的反問,開始認(rèn)識(shí)到學(xué)習(xí) “研究方法” 的重要性。之后蔣百川進(jìn)行了相關(guān)課程的學(xué)習(xí),并在實(shí)踐中不斷改進(jìn),逐步掌握了這方面的知識(shí)。2013年他退休后開始陸續(xù)撰文分享積累的經(jīng)驗(yàn)、心得體會(huì),并匯聚成一本《科學(xué)研究的方法》。《知識(shí)分子》獲作者授權(quán),將陸續(xù)為大家分享書中內(nèi)容,此為該系列的第三篇。
撰文 | 蔣百川(美國(guó)諾瓦東南大學(xué)教授)
責(zé)編 | 鄧志英
● ● ●
4.
如何提出研究問題和研究假設(shè)?
(1、2節(jié)請(qǐng)見本系列第一篇)
(3節(jié)請(qǐng)見本系列第二篇)
在這一部分,要講述實(shí)驗(yàn)的設(shè)計(jì)方法。由于研究領(lǐng)域的不同,做實(shí)驗(yàn)的方法也不一樣,所以不像閱讀文獻(xiàn)、綜述寫作一樣有比較共通的方法和規(guī)律可循,也不象在學(xué)術(shù)會(huì)議作報(bào)告及寫作科技論文那樣有比較刻板的模式?;谖冶救藢I(yè)的關(guān)系,這里介紹的方法主要用于醫(yī)學(xué)研究。對(duì)于其他領(lǐng)域,或許有參考價(jià)值,或許沒有,取決于你的具體問題。
1. 研究設(shè)計(jì)的含義和作用
在知道了想研究什么(what)以后,下一步是如何來(how)得到研究問題的答案。
傳統(tǒng)的研究設(shè)計(jì)是一份詳細(xì)的工作計(jì)劃:選擇可以測(cè)量的變量,決定所需的樣本大小,數(shù)據(jù)的收集(實(shí)驗(yàn)設(shè)計(jì))、統(tǒng)計(jì)分析,以及結(jié)論。研究設(shè)計(jì)是為了保證研究程序是妥適的,可以得到確實(shí)的(valid)、客觀的(objective)、精確的(accurate)關(guān)于所研究的問題的答案。
2. 在研究設(shè)計(jì)中對(duì)外部變量的考慮
一般的醫(yī)學(xué)研究(或某些其他研究)都是為了尋找一個(gè)原因。例如某種疾病的原因,某種藥物的療效。在上述第一種情況,產(chǎn)生疾病的原因就是自變量,而疾病則是因變量;在第二種情況,某藥物是自變量,而療效則是因變量。但是研究工作不會(huì)是那樣地簡(jiǎn)單,因?yàn)樵趯ふ疫@種自變量與因變量的關(guān)系時(shí),還參雜著許多外部變量 (如下圖的一個(gè)例子所示)。所以設(shè)計(jì)實(shí)驗(yàn)時(shí),首先必須清醒意識(shí)到有哪些外部變量,再采取如下的措施,或者排除、或者控制、或者包括進(jìn)測(cè)量中。
?圖1. 一個(gè)研究吸煙與肺癌關(guān)系的例子。此時(shí)還有許多因素作為中介變量影響研究結(jié)果,如果不對(duì)于這些因素采取適應(yīng)措施,本研究結(jié)果可能沒有意義。
措施一:保證外部變量對(duì)于對(duì)照組和實(shí)驗(yàn)組有相同的影響。
這里先提到一下對(duì)照組,下面還會(huì)詳細(xì)講。
(1)隨機(jī)化-保證兩組在各項(xiàng)外部變量方面是有可比性的。
(2)匹配-這是另一種保證兩組有可比性的方式。
措施二:減少外部變量。
有時(shí)候可將外部變量作為一個(gè)因素考慮在實(shí)驗(yàn)條件內(nèi),或者消除這個(gè)外部變量對(duì)結(jié)果的影響。
(1)將外部變量包括在實(shí)驗(yàn)設(shè)計(jì)中。例如,要研究?jī)和】捣?wù)對(duì)兒童死亡率的影響,由于兒童營(yíng)養(yǎng)供給對(duì)嬰兒死亡率也有很大影響,所以設(shè)計(jì)了2X2 因子的研究。在這樣設(shè)計(jì)中,既可以研究外部變量單獨(dú)的,以及與自變量聯(lián)合的對(duì)因変量的影響。
(2)消除外部變量。例如文化背景可能對(duì)健康(因變量)有很大影響,可選擇有相同文化背景的受試者,使問題簡(jiǎn)化。
3. 不同的研究設(shè)計(jì)
若以實(shí)驗(yàn)者接觸受試對(duì)象的次數(shù)分類,可有:
(1) 一次: 橫向研究 (cross-sectional study);
(2) 二次: 前后對(duì)照(before-after study);
(3) 三次或以上: 縱向研究(longitudinal study)。
若以研究所選擇的參照時(shí)間分類,可有:
(1) 回顧性(retrospective study);
(2) 前瞻性(prospective study) ;
(3) 回顧-前瞻 (retrospective-prospective study)。
若以研究性質(zhì)分類,可有:
(1) 實(shí)驗(yàn)性 (experimental study);
(2) 非實(shí)驗(yàn)性(non-experimental study);
(3) 半實(shí)驗(yàn)性(semi-experimental study) 。
此外還有根據(jù)實(shí)驗(yàn)者(主要是收集數(shù)據(jù)的人員)以及實(shí)驗(yàn)對(duì)象對(duì)于實(shí)驗(yàn)情況(實(shí)驗(yàn)的因変量,如在藥物療效的實(shí)驗(yàn)中對(duì)于服用藥物還是安慰劑的了解程度),可分為:
(1) 單盲研究(實(shí)驗(yàn)對(duì)象或受試者不了解以上情況);
(2) 雙盲研究(實(shí)驗(yàn)對(duì)象及上述的實(shí)驗(yàn)者均不了解以上情況)。
現(xiàn)將幾種主要方式再詳細(xì)介紹如下:
(1) 一次:橫向研究(cross-sectional study)
用于發(fā)現(xiàn)人群中某個(gè)現(xiàn)象、情形、問題、態(tài)度等的分布情況。橫向研究適合描述變量和它們分布模式的研究目的。也可以用于檢查自變量(predictor)和因變量(outcome)之間的相關(guān)性。
研究者若根據(jù)橫向研究的結(jié)果來討論自變量與因變量的因果關(guān)系,往往會(huì)犯錯(cuò)誤。例如在有一次國(guó)際會(huì)議上,新加坡一位資深同行根據(jù)兒童IQ與近視程度的相關(guān)性,下結(jié)論說IQ高的兒童因?yàn)闀x得多所以容易近視。她講完后,我上去質(zhì)疑,我說IQ高的兒童,聰明,所以往往可以不讀書就考第一,你如何證明IQ高的兒童一定讀書多?說得滿堂大笑。這里她至少犯了兩個(gè)錯(cuò)誤,一是這樣一個(gè)橫向研究結(jié)果,僅說明兩件事情的相關(guān)性,無法證明它們有因果關(guān)系;二是她在IQ及近視眼外,又引入了另一個(gè)變量,即讀書時(shí)間,并且不加證明地將讀書多與IQ劃上等號(hào)。這是搞科研工作不嚴(yán)謹(jǐn)?shù)谋憩F(xiàn)。
橫向研究的設(shè)計(jì) (見下圖)
橫向研究的設(shè)計(jì)步驟約為:
(1)確定研究問題;
(2)受試對(duì)象的取舍標(biāo)準(zhǔn)及取樣方法,得到樣本(sample);
(3)在這個(gè)取樣樣本中,需要觀察或測(cè)量哪方面的數(shù)據(jù),再將數(shù)據(jù)分解為下圖中的四塊;
(4)確立測(cè)量方法。
樣本的確定是研究設(shè)計(jì)的重要一步。如果實(shí)驗(yàn)對(duì)象太少,實(shí)驗(yàn)結(jié)果出來后會(huì)發(fā)現(xiàn)無法得出需要的統(tǒng)計(jì)結(jié)果;如果太多,則無疑增加實(shí)驗(yàn)成本,浪費(fèi)人力物力。樣本數(shù)的估算需要使用統(tǒng)計(jì)方法和公式,特別是要知道(或估計(jì))你的測(cè)量誤差,所以要作預(yù)實(shí)驗(yàn)。詳細(xì)的計(jì)算樣本大小的公式可在統(tǒng)計(jì)學(xué)書籍或相關(guān)程序中找到。
橫向研究的優(yōu)缺點(diǎn)
優(yōu)點(diǎn):一次性測(cè)量,快速、省錢,它的結(jié)果可以提示流行程度。這個(gè)方法可以作為縱向研究的第一步,測(cè)量結(jié)果可以作為被試對(duì)象的基線(baseline),并揭示橫向的變量的相關(guān)性。
缺點(diǎn):從所收集的數(shù)據(jù)中,無法得出因果關(guān)系。對(duì)于少見病的研究,這種方法在一般人群中取樣便不現(xiàn)實(shí)。但可以在有疾病的人群中取樣。例如在1000位有AIDS的病人中,727人有同性戀性行為,236人有吸毒行為,于是甚至不必有對(duì)照組,可以認(rèn)為這兩件事對(duì)于AIDS的發(fā)病率是有高度危險(xiǎn)的。
(2)二次: 前后對(duì)照研究 (before – after study)
優(yōu)點(diǎn):這是兩組橫向研究的數(shù)據(jù)。對(duì)于相同實(shí)驗(yàn)對(duì)象,可以發(fā)現(xiàn)在某種干預(yù)之下,他們的某個(gè)(些)變量發(fā)生的變化。
缺點(diǎn):
(1) 要做二次實(shí)驗(yàn),需相對(duì)長(zhǎng)的研究時(shí)間;
(2)受試者在第二次測(cè)量時(shí)可能丟失;
(3)測(cè)量的是總的變化,不能把因變量和外部變量的因素分離開來;
(4)時(shí)間可能改變受試者的某些條件;
(5)受試者的學(xué)習(xí),稱之為反應(yīng)性效應(yīng)(reactive effect);
(6)回歸效應(yīng)(regression effect)。在第一次測(cè)量時(shí)作極端反應(yīng)的受試者在第二次測(cè)量時(shí)會(huì)作趨向中間位置的反應(yīng) (見下圖)。
(3) 縱向研究(longitudinal study or cohort study)
這種研究有兩個(gè)基本目的。一是描述在一個(gè)時(shí)間段內(nèi)某種結(jié)果發(fā)生的情況;另一是分析危險(xiǎn)因子(risk factors)與這些結(jié)果之間的關(guān)聯(lián)。這種研究可以是前瞻性,也可以是回顧性的(如果已有數(shù)據(jù)可以回答研究問題)。
前瞻性的縱向研究:
例如用于分析發(fā)病率和相對(duì)危險(xiǎn)因子(見下圖)。
縱向研究通常是建立因(predictor)和果(outcome)變量之間的時(shí)間序列的唯一方法。最近在網(wǎng)上也經(jīng)常看到關(guān)于科學(xué)研究中對(duì)因果關(guān)系的討論,多數(shù)都說得很對(duì)。對(duì)于經(jīng)典研究而言,其最終目的是為了發(fā)現(xiàn)事物之間的因果關(guān)系。我以為最明了簡(jiǎn)單的表述是借助數(shù)學(xué)語言,即原因是結(jié)果發(fā)生的充分必要條件。由于原因的出現(xiàn),發(fā)生了這個(gè)結(jié)果(充分條件);沒有這個(gè)原因,便不發(fā)生這個(gè)結(jié)果(必要條件)。同時(shí),從時(shí)間序列角度,因必出現(xiàn)在果之前。從醫(yī)學(xué)實(shí)驗(yàn)研究角度,沒有縱向研究,在研究中沒有對(duì)照組,是無法確定因果關(guān)系的。
研究步驟:
(1)從群體取樣;
(2)測(cè)量預(yù)期變量(危險(xiǎn)因子,自變量);
(3)跟蹤該群體;
(4)測(cè)量結(jié)果變量(疾病,因變量)。
優(yōu)點(diǎn):
這種研究方法很有利于確定發(fā)病情況以及研究潛在的發(fā)病原因,因?yàn)槲kU(xiǎn)因子是在發(fā)病前所測(cè)量的。
缺點(diǎn):
對(duì)于發(fā)病率很低的疾病的研究,費(fèi)錢費(fèi)時(shí)。
如果變量之間的相關(guān)性是由于混雜變量(confounding variables)的關(guān)系,研究結(jié)果中發(fā)現(xiàn)的相關(guān)性可能會(huì)誤導(dǎo)研究者。
(4)實(shí)驗(yàn)性研究的設(shè)計(jì)及對(duì)照組問題
下圖表示沒有對(duì)照組的一個(gè)設(shè)計(jì):
這樣一個(gè)實(shí)驗(yàn)性研究的設(shè)計(jì),使得前后的測(cè)量數(shù)據(jù)有可比性。但是仍然不能確定任何(因變量)的變化,是否完全由干預(yù)(自變量)引起的。為了克服這個(gè)問題,必須引入對(duì)照組。
實(shí)驗(yàn)組與對(duì)照組的設(shè)定必須是隨機(jī)的,并且保證其他外部變量在兩組之間無統(tǒng)計(jì)差異。
在一項(xiàng)研究工作中,可靠的實(shí)驗(yàn)結(jié)果是基于縝密的實(shí)驗(yàn)設(shè)計(jì),所以實(shí)驗(yàn)設(shè)計(jì)是科學(xué)研究工作中重要的環(huán)節(jié)之一。有些學(xué)生急于著手實(shí)驗(yàn),沒有很好注意這個(gè)環(huán)節(jié),等到結(jié)果做出來以后,發(fā)現(xiàn)出了問題,還得從頭再來過。
更有人急于求成,違反科學(xué)道德,制造數(shù)據(jù)作假。需知你的工作若要真正有成就,首先是需要經(jīng)得起同行的重復(fù)與認(rèn)可,一旦作假被戳穿或者有人提出相反的證據(jù),都會(huì)對(duì)你的學(xué)術(shù)名譽(yù)造成損害。國(guó)內(nèi)目前對(duì)這種事情的處理太輕,也是造成某些人膽大妄為的原因。其實(shí)這樣的事情,還要從中學(xué)、大學(xué)里學(xué)生考試或作業(yè)作弊之類事情抓起,在美國(guó)新生入學(xué)時(shí),便對(duì)他們說清楚校規(guī)對(duì)作弊的處理,即一旦發(fā)現(xiàn),立即開除。
下一篇,將講述《科學(xué)研究的方法》中“數(shù)據(jù)的采集和處理”。
作者簡(jiǎn)介
蔣百川
美國(guó)NOVA東南大學(xué)教授,國(guó)際級(jí)眼視光學(xué)專家、美國(guó)視光研究院研究員,衛(wèi)生部近視眼研究所外方所長(zhǎng)。