sponsored links

預測蛋白質結構只是開始 AI或為生命科學領域帶來鉅變

過去半個多世紀,人類一共解析了5萬多個人源蛋白質的結構,人類蛋白質組裡大約17%的氨基酸已有結構資訊,而AlphaFold2預測的結構將這一數字從17%提高到58%。它帶來的在生命科學各分支領域的革命,將在今後幾年到十幾年中逐漸顯現出來。

蛋白質結構預測是生物學的重要“聖盃”,也是人工智慧落子生命科學領域最炙手可熱的研究之一。

近日,我國自研深度學習蛋白質摺疊預測平臺TRFold傳來好訊息,其基於2020年第14屆國際蛋白質結構預測競賽(CASP14)蛋白質測試集的成績僅次於“阿爾法摺疊的迭代版”(AlphaFold2),排名全球第二,這是國內目前所有公開蛋白質結構預測模型中的最好成績,我國計算生物學領域的表現躋身全球第一梯隊。

從2018年AlphaFold第一次代表人工智慧“參戰”,到AlphaFold2用機器學習方法取得媲美結構生物學實驗的精測精度,計算生物學給蛋白質預測這一世紀難題帶來了顛覆性的解法。人工智慧會給生命科學領域帶來怎樣的鉅變?蛋白質結構預測這個生物學裡懸而未決的終極難題之一,會被人工智慧徹底解決嗎?

深度學習可在計算生物學領域廣泛應用

蛋白質結構預測是生命科學領域一個由來已久、令人著迷的問題,同時又以難度大、成本高、進展有限著稱。但這個人們本以為需要一個世紀慢慢探索的問題近年來卻取得了重大突破:2020年CASP14競賽中,谷歌公司旗下的DeepMind公司研發的AlphaFold2取得了總分(GDT)92.4/100的成績,也就是說,計算生物學幾乎獲得了與實驗室方法精確度相當的蛋白質結構預測結果。

這個里程碑事件令結構生物學家們感慨,自己用價值1000萬美元的電鏡努力了好幾年得出的結果,Alphafold2竟然一下就算出來了。“依我之見,這是人工智慧對科學領域最大的一次貢獻,也是人類在21世紀取得的最重要的科學突破之一。”生物物理學家、西湖大學校長施一公不吝讚美。

為什麼要預測蛋白質結構?

天壤蛋白質摺疊專案負責人苗洪江對科技日報記者解釋,“研究蛋白質結構,有助於瞭解蛋白質的作用,理解蛋白質如何行使其生物功能,認識蛋白質與非蛋白質之間的相互作用,對於生物學、醫學和藥學等都非常重要”。

傳統觀測蛋白質結構的方法主要有3種,即核磁共振、X射線、冷凍電鏡,但這些方法往往依賴大量試錯和昂貴的裝置,每種結構的研究都要花費數年時間。而人工智慧應用於蛋白質結構預測的最新成果,即AlphaFold2,能在幾天甚至幾分鐘預測出以前要花費數十年才能得到的具有高置信度的蛋白質結構。

“剛開始大家還在開玩笑,說Deepmind是不是透過什麼方法盜取了真實實驗結果,直到大家看到文章和開原始碼才敢相信這件事情真的發生了。”苗洪江笑言,這側面證明AlphaFold2預測結果之震撼,“這開啟了人工智慧在計算生物學廣泛應用的大門,讓整個領域的人看到了深度學習在這個領域可以廣泛應用,這實打實的雙盲實驗結果就是證明。”

AI預測結果和實驗室水平相當

1994年,美國科學家約翰·莫爾特(JohnMoult)發起國際蛋白質結構預測競賽,每兩年舉辦一屆,競賽的舉辦正是為了吸引計算機科學、生物物理學等不同領域的專家參與到蛋白質三維結構預測這一極具挑戰性的生物資訊學問題中來。2018年,人工智慧正式參與蛋白質三維結構的預測,AlphaFold首次大顯身手,在98名參賽隊伍中排名第一。兩年後,AlphaFold2帶來真正的突破,它用機器學習方法對幾乎所有的蛋白質都預測出了正確的結構,其中有大約2/3的蛋白質預測精度達到了結構生物學實驗的測量精度。

事實上,過去半個多世紀,人類一共解析了5萬多個人源蛋白質的結構,人類蛋白質組裡大約17%的氨基酸已有結構資訊,而AlphaFold2預測的結構將這一數字從17%提高到58%,因為無固定結構的氨基酸比例很大,58%的結構預測已經接近極限了。它帶來的在生命科學各分支領域的革命,將在今後幾年到十幾年中逐漸顯現出來。

施一公在接受媒體採訪時曾談到,人類蛋白質組裡能夠被預測的以單個蛋白為單位的空間三維結構,已經基本都被AlphaFold2預測了。總體而言,預測結果可信、也比較準確。對結構生物學來說,這是一個顛覆性突破。此前人類尚未被解析的一些結構,現在基本上都已經被預測。

對生物化學、細胞生物學、遺傳發育、神經生物學、微生物學、病理藥理等一大批生命學科和研究領域來說,這會大大改進人們對於生命過程的理解。比如,遺傳學家也許積累了大量資料,但如果不知道蛋白質結構,就沒法研究某個突變對於蛋白功能的影響。現在不同了,透過AlphaFold2的結構預測就能檢視人類遺傳病中的每一個突變在相關蛋白結構裡的具體位置,進而有可能推測出蛋白功能如何受到影響。

再比如,DeepMind預測出來的蛋白結構,包括了眾多G蛋白偶聯受體和關鍵酶在內的一大批結構未知的藥物靶點蛋白,而且預測的結構足夠準確。這對於製藥界來說太重要了,等於提供了可靠的藥物設計和藥物最佳化的重要基礎。

單個蛋白質結構預測只是起點

今年7月,DeepMind公開了AlphaFold2的原始碼,並在《自然》上發表論文闡述了AlphaFold2的技術細節。

“這次開源在生物學界掀起了巨大的波瀾,意味著生物學家終於擺脫了先進裝置的掣肘——此前這些昂貴的先進裝置只有經費充足的大學或研究機構才有條件配置,而此後,小型團隊或者個人研究者也有了參與蛋白質研究的可能。”天壤創始人、上海交通大學計算機系原副教授薛貴榮說。

苗洪江認為,目前的單個蛋白質結構預測只是一個起點,更加精準的側鏈最佳化、蛋白質的動態分析、蛋白質與其配體(如小分子、DNA、RNA、多肽、蛋白質等)的相互作用等一系列的問題還沒有解決,接下來的工作重點將是利用目前的全蛋白質組協同進化分析,建立起蛋白質與蛋白質之間相互作用的精準鏈路。

有了演算法模型只是開始,向前走依然困難很多,薛貴榮坦言:“算力是很大的制約因素,比如AlphaFold2做了大量的資料蒸餾工作,他們的演算法模型是基於30%的真實資料和70%的蒸餾資料一起訓練的,背後是巨大的算力支援。”

充足的算力可以讓蛋白質結構預測從單一結構向相互作用、從兩兩研究向規模化、從微觀結構向宏觀系統前進,“生物界有很多蛋白結構,比如基因測序大概已經測了幾十億條序列。但我們只知道序列,不知道結構,這就是很大的資訊缺失問題。”薛貴榮說,“蛋白質通常以複合物的形式成對或成組地承擔生命所需的種種功能。然而許多蛋白質複合物的結構仍然是謎,蛋白質之間的相互作用也尚未被識別。我們需要有充足的算力去支撐整個體系,進行蛋白質結構預測、蛋白質設計,研究蛋白質相互作用,藥物研發等漫長而富有挑戰的工作,尋找精準的疾病治療新方法。”

同時,在資料來源和應用方面,也需要藥廠、醫院等進行協同和聯動。“未來更多的醫藥企業、機構,以及人工智慧公司,要一起把這個行業做大,現在只是個開始。”薛貴榮說。(記者 崔 爽)

來源:科技日報

分類: 健康
時間: 2021-12-16

相關文章

環球時報:四方機制正在變成包圍中國的“印太黑幫”

環球時報:四方機制正在變成包圍中國的“印太黑幫”
來源:環球時報 美日印澳四國領導人的首次面對面會晤星期五將在華盛頓舉行,這個"四方機制"以致力於"維護自由開放的印太地區"為名,行的卻是分裂整個地區.最大化地煽 ...

癌細胞為啥“老不死”?科學家發現一種關鍵酶,有望開闢抗癌新療法

癌細胞為啥“老不死”?科學家發現一種關鍵酶,有望開闢抗癌新療法
圖片來源@視覺中國 文丨學術頭條,作者丨庫珀,編審丨寇建超 細胞衰老是指一種穩定的細胞生長阻滯狀態,並伴有形態.生化及表觀遺傳的改變,腫瘤組織惡變前常可檢測到衰老細胞的存在. 長期以來,許多科學家認為 ...

四川省腫瘤醫院副主任醫師許川:潛心臨床轉化研究 為患者帶去福音

四川省腫瘤醫院副主任醫師許川:潛心臨床轉化研究 為患者帶去福音
人力資源報見習記者 陳鵬 影片 見習記者龔民君 人物名片 許川 電子科技大學醫學院教授,四川"天府峨眉計劃"專家,四川省腫瘤醫院副主任醫師,醫學博士,博士研究生導師.從事腫瘤綜合治 ...

矢志奮鬥 自立自強——“兩彈一星”精神述評

矢志奮鬥 自立自強——“兩彈一星”精神述評
[中國共產黨人的精神譜系] 光明日報記者 齊芳 顏維琦 走進中國共產黨歷史展覽館,能清晰地感受到一部濃縮的科技強國史:嫦娥五號探測器著陸器."墨子號"量子衛星.C919大飛機--一 ...

中國力量:中山大學接連發表食管癌和大腸癌突破

中國力量:中山大學接連發表食管癌和大腸癌突破
JAMA:中山大學團隊報道晚期/轉移性食管鱗癌免疫治療臨床新進展 JAMA--[56.272] ① 招募596名晚期或轉移性食管鱗狀細胞癌患者,隨機接受camrelizumab+化療或安慰劑+化療的聯 ...

新研究找到腸癌潛在治療靶點
近日,上海交通大學醫學院附屬仁濟醫院消化科研究員洪潔和陳豪燕團隊發現,產腸毒素脆弱類桿菌(ETBF)處理大腸癌細胞後產生的外泌體中miR-149-3(微小RNA miR-149-3p)減少,促進了Th ...

京東OLAP實踐之路

京東OLAP實踐之路
導讀:本文主要介紹京東在構建OLAP從無到有各環節考慮的重點,由需求場景出發,剖析當前存在的問題,並提供解決方案,最後介紹OLAP的發展過程. ▌需求場景 1. 京東資料入口 ① 業務資料:訂單 京東 ...

鼻咽癌治療“中國方案”或改寫全球標準
我國創新藥物研究成果首獲<自然·醫學>封面推薦 鼻咽癌治療"中國方案"或改寫全球標準 本報記者 馬愛平 近日,<自然·醫學>創刊26年來首次在封面推薦了中國 ...

兩部門聯合印發通知 部署開展秋季開學在校學生毒品預防教育
央視網訊息:據公安部網站訊息,為切實落實國家禁毒委員會關於加強新時代全民禁毒宣傳教育工作的指導意見,鞏固學校毒品預防教育成果,進一步增強在校學生識毒防毒拒毒意識和能力,近日,國家禁毒委員會辦公室.教育 ...

旅遊度假區等級劃分標準(GB/T26358-2010)

旅遊度假區等級劃分標準(GB/T26358-2010)
旅遊度假區等級劃分標準 引言 隨著經濟的發展和旅遊市場的細分,度假旅遊已成為當前旅遊業發展的一個重要趨勢.本標準旨在制定旅遊度假區等級劃分的依據,以利於引導旅遊度假區加強管理,提高服務質量,促進旅遊度 ...

領航中華腫瘤防治 踐行健康中國行動——2021中華腫瘤大會在蓉開幕

領航中華腫瘤防治 踐行健康中國行動——2021中華腫瘤大會在蓉開幕
2021年10月9日-10日,由中華醫學會.中華醫學會腫瘤學分會主辦,四川省醫學會.電子科技大學醫學院附屬腫瘤醫院·四川省腫瘤醫院共同承辦,中山大學腫瘤防治中心.南方腫瘤臨床研究協會共同協辦的2021 ...

陌辰談巔峰第一感受,一二十連勝正常!反觀微涼網友質疑匹配機制

陌辰談巔峰第一感受,一二十連勝正常!反觀微涼網友質疑匹配機制
在如今已經瀕臨賽季末,大量的選手和主播都開始自己的衝分之旅,不過在這次衝分卻出現兩個他們望塵莫及的主播,那就是微涼和陌辰.微涼和陌辰可以說是這次巔峰賽的首位的有力競爭者,因為兩人幾乎同時登陸2700分 ...

淺談中國電信及綠鞋機制的認知
絕大多數人對綠鞋機制還是認識不足,中金買的都是綠鞋機制內的股票,這些需要交割給對應的戰略投資者,不是他們自己下場來炒作.交割以後會被限售12個月至三年的解禁,只是這樣一來,對應的流通盤變少了,估計會從 ...

解密早培班:家長說沒見識過人大附中的早早培,都不配談“雞娃”

解密早培班:家長說沒見識過人大附中的早早培,都不配談“雞娃”
2012年的北京人大附中校門口.這裡的早培班.早早培,被喻為北京"雞娃"的天花板.圖中學生與本文無關. (張濤/圖) 2021年9月13日晚間,在北京多年從事理科培訓的機構老師陳立 ...

JGR:中國東北五大連池富鉀板內火山成因機制——來自背景噪聲和遠震面波聯合成像的新證據

JGR:中國東北五大連池富鉀板內火山成因機制——來自背景噪聲和遠震面波聯合成像的新證據
陳瑛等-JGR:中國東北五大連池富鉀板內火山成因機制--來自背景噪聲和遠震面波聯合成像的新證據 全球大多數成因與板塊活動有關的火山沿著板塊邊界分佈,而一些遠離板塊邊界的板內火山,其成因不能用經典的板塊 ...

江山代有才人出——任正非與華為科研人員談科技創新

江山代有才人出——任正非與華為科研人員談科技創新
我不是科學家,也不是電子類的專家,即使過去對工程技術有一點了解,和今天的水平差距也巨大.今天跟大家對話,我倒不會忐忑不安,說錯了你們可以當場批評.畢竟你們是走在科技前沿的人,我錯了也沒有什麼不光榮,畢 ...

大家談④:臥虎山小學校長伏聖娟
大家談④:臥虎山小學校長伏聖娟 2021-09-17 17:40 責任編輯:劉雯雯 岱嶽教育開闢"聚焦市區教師節大會:大家談"欄目,各鎮街教辦主任.區直學校校長以及部分中小學校長代 ...

季羨林談人生價值

季羨林談人生價值
今天是季羨林先生逝世12週年.季羨林先生學貫中西.享譽中外.德高望重,是名副其實的學術巨擘.國學大師. 下面分享<季老在愛中永生--羨林師言傳身教實錄>中的一個篇章,讓我們一起懷念季羨林先 ...

瞭解日本 讀講談社日本的歷史

瞭解日本 讀講談社日本的歷史
主題:山川異域,風月同天--"講談社·日本的歷史"新書首發式 時間:2021年6月15日19:30 地點:PAGEONE五道口店 嘉賓:湯重南 中國社會科學院研究員 王 勇 浙江大 ...

2021年世界計算大會“應用數學與人工智慧”名家講堂開講

2021年世界計算大會“應用數學與人工智慧”名家講堂開講
來源:紅網-時刻新聞 "應用數學與人工智慧"名家講堂現場. 紅網時刻9月17日訊(記者 何青 攝影 張必聞 通訊員 劉亞橋)數學是人工智慧創新發展的基礎,能夠為人工智慧產業發展所面 ...