宿兵研究組發(fā)布高質(zhì)量中國恒河猴基因組序列
? 圖片來自unsplash.com
● ● ●
恒河猴(Macaca mulatta)是生物科學(xué)研究和新藥研發(fā)廣泛應(yīng)用的非人靈長類實驗動物。構(gòu)建一個高質(zhì)量的恒河猴基因組是開展相關(guān)研究的重要基礎(chǔ)。當(dāng)前國際上廣泛使用的是印度恒河猴的參考基因組,但這個主要基于二代測序的恒河猴參考基因組組裝質(zhì)量較差,序列碎片化和缺失嚴(yán)重,極大地限制了它的應(yīng)用,特別是無法用于對基因組結(jié)構(gòu)變異(Structural Variant,SV)的解析。
宿兵課題組運用三代長讀長測序技術(shù)(PacBio),并結(jié)合多種基因組輔助組裝技術(shù)(Bionano光學(xué)圖譜技術(shù)、Hi-C互作圖譜技術(shù)、以及Iso-Seq測序技術(shù))組裝了一個高質(zhì)量的中國恒河猴參考基因組——rheMacS。相比于目前的印度恒河猴參考基因組,rheMacS的基因組質(zhì)量提高了75倍,并填補了2萬多個之前參考基因組存在的缺口(gaps)。另外,研究人員共采集了10種中國恒河猴的組織進行Iso-Seq和RNA-Seq測序,產(chǎn)生了超過2百萬條全長轉(zhuǎn)錄本數(shù)據(jù)和185Gbp的短讀長轉(zhuǎn)錄組數(shù)據(jù),為中國恒河猴參考基因組的功能注釋提供了關(guān)鍵數(shù)據(jù)。
利用構(gòu)建的高質(zhì)量中國恒河猴基因組,研究人員在恒河猴中發(fā)現(xiàn)了5萬多個新的SVs;尤為重要的是,他們通過與已發(fā)表的高質(zhì)量猿類基因組進行深度比較分析,首次發(fā)現(xiàn)了17,000個猿類特有的結(jié)構(gòu)變異(ASSVs)。
進一步的研究表明,大量的ASSVs發(fā)生在猿類與恒河猴存在活性差異的增強子區(qū)域。通過對這些ASSVs進行功能注釋,研究人員找到了一系列與猿類重要表型特征相關(guān)的ASSVs,如尾巴丟失、大腦容量增加以及體型變大等。該研究發(fā)布的中國恒河猴基因組將對未來的生物醫(yī)學(xué)研究提供重要的基礎(chǔ)數(shù)據(jù),并為解析包括人類在內(nèi)的靈長類表型進化的遺傳基礎(chǔ)提供新的思路。
該研究以Long-read assembly of the Chinese rhesus macaque genome and identification of ape-specific structural variants為題,于2019年9月17日在Nature Communications發(fā)表。
中國科學(xué)院昆明動物所和耀喜副研究員為論文的第一作者,博士研究生羅鑫、周斌,碩士研究生胡庭和博士研究生孟曉宇為該文的共同第一作者。宿兵研究員為該文的通訊作者。該研究得到華盛頓大學(xué)Evan Eichler教授、Peter Audano博士和Zev Kronenberg博士在數(shù)據(jù)分析方面的幫助。該研究受到中科院戰(zhàn)略先導(dǎo)專項、國家自然科學(xué)基金委重點項目、國家自然科學(xué)基金委創(chuàng)新群體項目以及云南省萬人計劃領(lǐng)軍人才項目的資助。
論文鏈接:https://www.nature.com/articles/s41467-019-12174-w
注:本文轉(zhuǎn)載自遺傳資源與進化國家重點實驗室。