7分鐘,有多長?不到兩首歌的時間。
7分鐘,能做什麼?今天,在中國,7分鐘能完成人類全基因組測序,這是過去要花13年才可以完成的事。
2021年,四川大學華西醫院、華為、賽樂基因科技聯合釋出多組學資料加速分析平臺,將人類全基因組測序時間從24小時縮短至7分鐘。這是全球首次將人類全基因組分析推進至分鐘級,具有跨時代的意義。
這有多難,中國又是怎麼做到的?央視新聞走進華西醫院進行揭秘。
基因測序與我們有什麼關係?
基因測序是一種新型基因檢測技術,人類基因組約含6萬到10萬個基因,由約30億個鹼基對組成,分佈在細胞核的23對染色體中,基因測序從血液或唾液中分析測定基因全序列,從而預測罹患多種疾病的可能性,個體的行為特徵及行為合理。基因測序技術能鎖定個人病變基因,提前預防和治療,在生殖健康、遺傳病篩查、腫瘤診斷及治療、特別是在SARS和新冠病毒的特殊時期,都曾發揮重要作用。
1990年,學界正式啟動“人類基因組計劃”,直到2003年才完成人類基因組計劃的測序並公佈其初步成果——人類基因組序列與基因圖譜。這次測序耗費了13年,30億美元,但也從此拉開了“數字基因”時代的帷幕。
基因測序難在哪兒?
基因測序及分析是個非常浩大的工程,分為三個環節:提取,分析和解讀。其中分析階段包含檔案格式轉換、解壓縮、基因拼接、比對、排序、去重、變異檢測以及聯合基因型檢測,簡單地說,測序需要先把基因組複製一批,然後打成長短不同的碎片,然後再測序,對比和拼接,每一個碎片都可能和幾億、幾十億個小碎片檔案對比分析,資料量非常非常龐大,測序和分析難度可想而知。
人類首次完成人類基因組測序耗費了13年,隨著技術的不斷髮展,到了2019年,這個時間被縮短到了1天。但這樣的速度仍不足以支撐基因測序真正廣泛推廣到臨床應用上。想要提升分析效率,繼續縮短該階段的時間,關鍵在於提升生信分析系統的效能,必須要有一個大容量、大記憶體、混合負載、高頻寬的資料底座才能夠支撐好上層的應用與服務。
如何將基因測序縮至7分鐘?
要挑戰基因組分析這樣的世界級難題,從架構到儲存到計算,樣樣非行業內頂尖技術不可。華西醫院快速鎖定了北京賽樂基因和華為儲存兩家機構。華西醫院在多模態組學資料分析和基因應用等領域有著先進學術和產業優勢,成立多組學資料加速分析平臺。華為公司在高效能資料儲存和先進基因資料管理系統上的技術積累豐厚,華為OceanStor Pacific海量儲存提供更高效能儲存底座。賽樂基因在GPU加速生物資訊資料分析領域的行業經驗領先,提供超快速NGS資料分析平臺BaseNumber。
經過三方基於架構、計算、儲存的多維創新,聯創平臺在全球首次將全基因組分析流程縮短到7分鐘,相比現有平臺提速3.5倍,相比傳統方案更是提升180倍。
華西生物醫學大資料中心資料科學家於浩澎博士表示:
按照傳統方案,我們獲取一個人的遺傳變異資料,大概需要24小時。現在經過我們方案最佳化,在7分鐘內就可以完成,因為我們進行了兩個方面的突破,一個是計算算力的瓶頸打破,一個是儲存效能的瓶頸打破。
在第六屆生物醫學大資料·智慧技術應用峰會上,華西生物醫學大資料中心資料科學家於浩澎博士釋出了“WHS-IMOAP”高效能基因組分析聯合解決方案,宣告全球首次將人類全基因組分析推進分鐘級時代。
此項研究成果的釋出,直接加速了基因測序從科研到臨床的程序,這意味著,今後我們可以得到更多精準的基因資料來輔助醫療診斷及治療。知其然,知其所以然,揭開基因的神秘面紗,人類乃至萬物的生老病死從此不再不可預測。
華西生物醫學大資料中心常務副主任曾筱茜表示:
基因測序以前只能在實驗室裡面開展的科研專案,現在也越來越走進了尋常百姓的臨床應用。
未來,也許我們可以攻克基因缺陷這樣亙古難變的醫學難題,根治腫瘤、艾滋以及各類遺傳疾病,為無數的患者帶去重生的希望。不止於此,基因組學已經在許多領域,包括醫學,生物技術,人類學和其他社會科學都提供了廣泛的應用。而分鐘級的基因測序為基因組學的發展提供了更高效的分析平臺。歷史的長路上豎立著人類社會發展的每一塊里程碑,這一次,我們在上面刻下,7分鐘,這是中國速度!