首頁 新聞 > 研究 > 正文

從24小時到7分鐘 華西醫(yī)院刷新基因分析“中國速度”

2月18日,四川大學(xué)華西醫(yī)院發(fā)布消息,該院生物醫(yī)學(xué)大數(shù)據(jù)中心將人類全基因組測序時間從24小時縮短到7分鐘,刷新了基因分析的“中國速度”。這也意味著,該項(xiàng)研究成果直接加速了基因測序從科研到臨床的進(jìn)程,未來將有更多精準(zhǔn)的基因數(shù)據(jù)輔助于醫(yī)療診斷及治療。

研發(fā)團(tuán)隊(duì)簽署項(xiàng)目合作協(xié)議。采訪對象供圖

基因測序和分析技術(shù)現(xiàn)已應(yīng)用于生育健康、腫瘤個體化診斷和治療、遺傳病、傳染病檢測、疫苗研發(fā)等領(lǐng)域。在該領(lǐng)域一個不可避免的“攔路虎”就是——時間。以四川大學(xué)華西醫(yī)院啟動的“十萬中國罕見病患者全基因組測序計(jì)劃”項(xiàng)目為例,按照傳統(tǒng)技術(shù)30X人類全基因組數(shù)據(jù)分析24小時/例的速度計(jì)算,該項(xiàng)目投入100臺計(jì)算機(jī)也需要30多年才能完成。

2021年6月,華西醫(yī)院聯(lián)合華為、賽樂基因組建聯(lián)合研發(fā)團(tuán)隊(duì),開展多組學(xué)數(shù)據(jù)加速分析平臺系統(tǒng)的開發(fā)。面向大規(guī)模隊(duì)列多組學(xué)數(shù)據(jù)分析應(yīng)用場景,研發(fā)團(tuán)隊(duì)聚焦多組學(xué)數(shù)據(jù)分析“存、管、算”三個方向,包括開發(fā)多組學(xué)數(shù)據(jù)專項(xiàng)訓(xùn)練的存儲自動分級技術(shù),在數(shù)據(jù)分析過程中提供高I/O和低成本的存儲方案;面向存儲系統(tǒng)的管理維護(hù)者,研發(fā)基于邏輯層的組學(xué)數(shù)據(jù)全生命周期的存儲管理系統(tǒng);基于GPU異構(gòu)并行加速技術(shù),將原來在CPU上運(yùn)行的bwa和STAR等分析軟件重構(gòu)遷移到GPU上,充分利用GPU運(yùn)算高并發(fā)的特征,以滿足高效、低成本完成組學(xué)分析的需求。

該項(xiàng)目負(fù)責(zé)人、華西生物醫(yī)學(xué)大數(shù)據(jù)中心于浩澎副研究員表示,之所以能實(shí)現(xiàn)時間上質(zhì)的突破,根本在于打破計(jì)算算力和儲存性能的瓶頸。他將其形象地比喻為吃得快的“大嘴巴”和裝得下的“大肚子”。前者實(shí)現(xiàn)了大文件的直通讀取和小文件的聚合讀取,數(shù)據(jù)讀取的效率更高;后者可以對數(shù)據(jù)分析的各個作業(yè)流程進(jìn)行融合調(diào)度的優(yōu)化,I/O流更加順暢,從而實(shí)現(xiàn)了“吃得更多、消化更快”。

他表示,研發(fā)團(tuán)隊(duì)在全基因組數(shù)據(jù)分析加速上,以GATK(The Genome Analysis Toolkit)流程為基礎(chǔ),最終完成了速度的飛躍,實(shí)現(xiàn)了30X人類全基因組測序胚系變異分析時間從24小時到7分鐘的壓縮,同時保證了分析結(jié)果的準(zhǔn)確性:和GATK結(jié)果高度一致。

關(guān)鍵詞: 數(shù)據(jù)分析 研發(fā)團(tuán)隊(duì) 數(shù)據(jù)中心 生物醫(yī)學(xué) 四川大學(xué)華西醫(yī)院

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2018 創(chuàng)投網(wǎng) - 670818.com All rights reserved
聯(lián)系我們:33 92 950@qq.com
豫ICP備2020035879號-12