遺傳發(fā)育所開發(fā)水稻分子育種整合組學知識庫
10月18日,中國科學院遺傳與發(fā)育生物學研究所植物基因組學國家重點實驗室梁承志研究組開發(fā)的分子育種整合組學知識庫水稻子庫在線發(fā)表于學術期刊《核酸研究》(Nucleic Acids Research)。文章題目為MBKbase for rice: an integrated omics knowledgebase for molecular breeding in rice。
種質(zhì)資源是作物遺傳改良的基礎。近年來高通量測序技術的發(fā)展已為解析作物種質(zhì)材料的遺傳變異和基因功能提供了大量的組學數(shù)據(jù)。單分子測序技術的發(fā)展也幫助構(gòu)建了重要作物的多個參考基因組,為高質(zhì)量泛基因組的構(gòu)建提供了基礎。整合這些組學數(shù)據(jù)將大大有利于對其的重復利用和深度挖掘。預期隨著高通量表型采集技術的發(fā)展,育種大數(shù)據(jù)體量將不斷增加,數(shù)據(jù)的整合和分析將越來越困難,因而建立一個通用的育種組學大數(shù)據(jù)整合分析平臺對作物基因功能研究人員和育種工作者都至關重要。
梁承志團隊多年來在高質(zhì)量基因組組裝和注釋的基礎上,致力于構(gòu)建一個整合的作物組學知識庫。該知識庫旨在揭示種質(zhì)材料的基因型以及跟表型信息在群體中的關聯(lián),設計了各類育種相關的組學數(shù)據(jù)的存儲規(guī)范,適用于整合多物種種質(zhì)信息、多參考基因組和泛基因組,尤其是海量的群體基因組重測序數(shù)據(jù)的存儲和展示。目前該知識庫的水稻子庫展示了兩個參考基因組和基因信息(另一個參考基因組數(shù)據(jù)也將很快公開)及近7000余份全球水稻重測序數(shù)據(jù),大量水稻種質(zhì)資源信息數(shù)據(jù),400多萬條表型記錄值,1.3萬個已知基因的功能注釋等。在這些重測序的水稻種質(zhì)資源遺傳信息中,蘊含著大量的可用于改造水稻品質(zhì)、增加抗性、提高產(chǎn)量的優(yōu)良等位基因。通過在線用戶自定義基因分型與表型數(shù)據(jù)的關聯(lián)展示,首次實現(xiàn)了在線基因型到表型大數(shù)據(jù)的可視化實時展示。該知識庫在基因型水平上進行多功能軟件開發(fā),實現(xiàn)了基于基因型的種質(zhì)篩選、個體比較、變異分析、基因型在線注釋等復雜功能。此外,該知識庫具備數(shù)據(jù)的動態(tài)擴展功能,適于收集和導入新的作物群體重測序數(shù)據(jù),并能夠與原有數(shù)據(jù)集進行整合分析。水稻子庫的建立也為其他作物比如大豆、小麥和玉米奠定了一個良好的基礎。
論文第一作者為梁承志研究組博士生彭驊,梁承志為通訊作者。數(shù)據(jù)庫開發(fā)得到基因組分析平臺的大力支持和幫助。數(shù)據(jù)庫設備也得到植物基因組學國家重點實驗室的支持。該研究得到中科院戰(zhàn)略性先導科技專項(A)“分子模塊設計育種創(chuàng)新體系”等的資助。
注:本文轉(zhuǎn)載自中國科學院遺傳與發(fā)育生物學研究所。