sponsored links

百圖生科首席AI科學家宋樂:AI,幫助製藥人逃逸“雙十”怪圈

7 月 30 日,成立不到一年的百圖生科(BioMap)宣佈完成上億美元的 A 輪融資,這家由李彥宏牽頭髮起並親任董事長、原百度風投 CEO 劉維作為聯合創始人兼 CEO 掌舵的「中國首家生物計算驅動的生命科學平臺公司」向外界放出雄心:

公司致力於用高效能生物計算和多組學資料技術加速創新藥物和早篩早診等精準生命科學產品的研發,力圖讓更多疾病可預警、可控制、可治癒,為行業提供更好的生物地圖(BioMap),幫助藥廠找到化合物,幫助醫生找到生物標誌物,幫助科研人員找到各種生物資料背後的意義。

不久之前,國際機器學習大牛又宋樂加入李彥宏生物計算軍團。為世界知名機器學習專家,他領導著百圖生科 AI 演算法團隊,為獨具特色的生物計算引擎研發提供技術動力。

宋樂博士是著名的機器學習和圖深度學習專家,曾任美國佐治亞理工學院計算機學院終身教授、機器學習中心副主任,阿聯酋 MBZUAI 機器學習系主任,螞蟻金服深度學習團隊負責人(P10)、阿里巴巴達摩院研究員,國際機器學習大會董事會成員,具有豐富的 AI 演算法和工程經驗。

自 2008 年起,宋樂博士在 CMU 從事生物計算相關的研究,利用機器學習技術對靶點挖掘、藥物設計取得了一系列突破性成果,獲得 NeurIPS、ICML、AISTATS 等主要機器學習會議的最佳論文獎。社群服務方面,他曾擔任 NeurIPS、ICML、ICLR、AAAI、IJCAI 等 AI 頂會的領域主席,並將出任 ICML 2022 的大會主席,他還是同行評議期刊 JMLR、IEEE TPAMI 的副主編。

近日,由雷峰網 & 醫健AI掘金志主辦的GAIR「醫療科技高峰論壇」在深圳正式召開。

這一次,醫健AI掘金志以「醫療AI的破局與新生 」為主題,將話筒傳遞給四位院士、5位IEEE Fellow、19位行業領袖,由他們以分別從歷盡鉛華的醫學影像AI、和風勁正濃的AI製藥兩大賽道出發,為行業的發展提出自己的判斷。

論壇之上,百圖生科首席AI科學家,ICML 2022大會主席宋樂,以《用人工智慧賦能新藥研發》為題,發表了一場演講。

宋樂教授提到,大家在憧憬AI可以在新藥發現領域展現巨大作用的同時,還有三個問題要提前考慮。

第一個挑戰,瞭解複雜疾病的困難。例如胃癌,因為胃連線不同器官;細胞層面上,每個器官有不同細胞進行不同作用,細胞之間通性也是很複雜的網路;分子層面,細胞裡有各種各樣蛋白質等分子產生相互作用,也形成了很複雜的網路。所以,如果為一種胃部疾病找合適治療靶點,就需要對整個網路有透徹的瞭解。

需要測量每一個環節、每一個尺度,包括整個機體組織尺度,整個組織的切片,細胞之間如何通訊,如何表達這些基因。甚至要看到細胞裡的蛋白質互相作用,收集這些資料會非常複雜。

例如,需要測量單個細胞基因表達量,蛋白質表達量。甚至還需要同時測量單個細胞基因表達、不同細胞在空間、組織裡面的表達。

第二,對於包括基因層面的基因測序、表觀組,蛋白質表達、蛋白質代謝,組織層面、機理層面等多維度、多尺度的資料,如何進行復雜且多樣化的融合處理。

傳統方式是對每個維度分開分析,再透過人來做整合;現在可以用AI將多尺度、多樣化資料整合。 除了資料多樣性問題,資料量增加也非常快,生物資料每7個月翻一倍。

第三個挑戰,行業配合問題。資料分析與實驗往往是兩波人,他們之間的溝通缺乏一個非常高效的系統,將預測、模型輸出和試驗系統進行整合,加速迭代。

通常情況下,都是資料分析員根據根據已有知識在腦海裡形成假設,然後讓實驗員做實驗;有了資料後,再給資料分析團隊分析,驗證假設是否成立,決定下一次實驗。

整個實驗-資料分析-模型環節比較開環,但不是完全開環,缺少一個非常高效的系統,將預測或模型輸出和實驗系統整合,加速迭代過程。

以下是演講的全部內容,雷峰網做了不改變願意的整理和編輯:

今天我分享一下對人工智慧賦能醫藥的理解以及行業現狀,人工智慧在這個領域能做些什麼。

首先,這個行業面臨很大的挑戰,我將其定義為雙十挑戰。

第一,醫藥研發漫長;每個新藥從研發到上市需要10年時間甚至更多,藥物篩選過程非常艱難。

很多藥物都是小分子或蛋白質,種類極多,篩選空間甚至有10的60次方,從這麼大範圍找出最終的藥物分子,並推到上市,其實非常艱難。

計算節點上,要從10的60次方中找到1萬種,再從裡面選幾百個做Preclinical測試,之後再做臨床試驗,整個過程中每一步都有很高的失敗率。

而且,前期篩選經常預測不到後期屬性,導致產物後期無法使用,就要從頭重新篩選,週而復始。

百圖生科首席AI科學家宋樂:AI,幫助製藥人逃逸“雙十”怪圈


第二個“十”是指,開發一個新藥大約需要10億美金左右的造價。1950年還有很多比較容易治療的疾病未被治癒,

如果當時有10億美金投入,可以發現幾十個藥物。但現在面對的都是比較難的疾病,並且現在我們對藥物的療效、副作用減少的要求越來越高,監管要求越來越嚴。

所以10億美金只能發現一個新藥物。如果我們能把新藥研發的造價降低、成功率提升的話,也可以節約研發經費,這個市場是巨大的。

百圖生科首席AI科學家宋樂:AI,幫助製藥人逃逸“雙十”怪圈


所以AI新藥研發面對的是一個非常廣闊的市場,但大家在憧憬AI可以在新藥發現領域展現巨大作用的同時,還有三個問題要提前考慮:

第一個挑戰,瞭解複雜疾病的困難。例如胃癌,因為胃連線不同器官;

細胞層面上,每個器官有不同細胞進行不同作用,細胞之間通性也是很複雜的網路;

分子層面,細胞裡有各種各樣蛋白質等分子產生相互作用,也形成了很複雜的網路。

所以,如果為一種胃部疾病找合適治療靶點,就需要對整個網路有透徹的瞭解。

需要測量每一個環節、每一個尺度,包括整個機體組織尺度,整個組織的切片,細胞之間如何通訊,如何表達這些基因。甚至要看到細胞裡的蛋白質互相作用,收集這些資料會非常複雜。

例如,需要測量單個細胞基因表達量,蛋白質表達量。甚至還需要同時測量單個細胞基因表達、不同細胞在空間、組織裡面的表達。

百圖生科首席AI科學家宋樂:AI,幫助製藥人逃逸“雙十”怪圈


第二,對於包括基因層面的基因測序、表觀組,蛋白質表達、蛋白質代謝,組織層面、機理層面等多維度、多尺度的資料,如何進行復雜且多樣化的融合處理。

傳統方式是對每個維度分開分析,再透過人來做整合;現在可以用AI將多尺度、多樣化資料整合。

除了資料多樣性問題,資料量增加也非常快,生物資料每7個月翻一倍。

但是傳統方式分析效率卻不高,所以就需要AI模型用HPC方式,把資料裡有用或微弱的資訊整合。

百圖生科首席AI科學家宋樂:AI,幫助製藥人逃逸“雙十”怪圈


第三個挑戰,行業配合問題。資料分析與實驗往往是兩波人,他們之間的溝通缺乏一個非常高效的系統,將預測、模型輸出和試驗系統進行整合,加速迭代。

通常情況下,都是資料分析員根據根據已有知識在腦海裡形成假設,然後讓實驗員做實驗;有了資料後,再給資料分析團隊分析,驗證假設是否成立,決定下一次實驗。

整個實驗-資料分析-模型環節比較開環,但不是完全開環,缺少一個非常高效的系統,將預測或模型輸出和實驗系統整合,加速迭代過程。

百圖生科首席AI科學家宋樂:AI,幫助製藥人逃逸“雙十”怪圈


為了解決這三個挑戰,有必要形成一個AI-實驗的閉環系統,把預測和溼試驗的環節打通到同一個系統。

百圖生科建立了乾溼試驗閉環的高通量平臺,這個平臺在AI模型有一個巨大的場景,可以整合現有的資料,產生異構的、複雜的知識圖譜。

基於知識圖譜可以進行AI模型擬合,或者整合這些資料並且產生預測。例如要探究某個蛋白質是不是某個疾病的靶點,或者我們設計出方案是不是針對這個靶點有效,直接發放給實驗系統,收集到的可能是生物實驗資料,可能是翻譯的資料,甚至是影象資料,很快可以透過AI模型或者計算機視覺方法更新,再進行下一個實驗。

百圖生科首席AI科學家宋樂:AI,幫助製藥人逃逸“雙十”怪圈


接下來,我再介紹一下AI主要在每個環節可以做什麼,大概分為三部分:

第一,在藥物發現階段找到新靶點;

第二,根據靶點設計新的藥物分子;

第三,在試驗閉環階段進行互動學習。

下面具體列舉幾個案例:

第一個案例,AI找出目標蛋白質,例如在複雜蛋白質相互作用網路,或訊號通路里找出蛋白質。

細胞膜上有很多蛋白質,阻斷或啟用膜蛋白的作用就會產生細胞間的生物作用。而且,每個蛋白質在不同疾病裡,對應蛋白質表達單元也不一樣。

尋找針對某個疾病表現的蛋白質,就需要把得到的細胞基因表達資料、蛋白質表達資料整合到同一網路裡。

過去,有很多生物學家做了這方面研究,模型做得很複雜,將很多複雜的AI模型遷移到生物網路裡。

例如在生物計算領域,蛋白質之間連線產生了非常複雜相互作用網路。

這個網路不單是兩兩蛋白質作用,也可能有三、四個蛋白質相互形成作用。蛋白質又關係到關鍵基因表達,每個節點有非常複雜的屬性,就需要用圖神經網路進行推理。

百圖生科首席AI科學家宋樂:AI,幫助製藥人逃逸“雙十”怪圈


我們也可以借鑑其他領域的圖神經網路模型,融合在一起學習更好的模型。

圖神經網路是現在比較火的領域,大量搜尋的經驗都可以遷移到靶點發現領域,讓靶點發現變得更有效,融合各種各樣資訊。

第二個案例,AI怎樣針對靶點設計有效藥物。一般藥物都是有機小分子或大分子,或蛋白質或RNA。

所以,設計藥物就要涉及很多小分子性質和大分子結構預測。例如AlphaFold 2可以根據給定序列預測蛋白質結構。

蛋白質的結構對其功能、作用非常關鍵,如果知道蛋白質功能結構就可以更好了解其功能,所以,準確蛋白質結構對設計結構非常關鍵。

除了蛋白質,AI領域還能看到各種各樣搜尋。例如RNA分子二級結構、三級結構,如果AI預測出這些結構對RNA藥物設計也有幫助。

除此之外,各種各樣小分子以及它們的屬性,毒性、水溶性,針對某一個靶點的有效性,也都可以透過AI模型預測。

其實,生物製藥的資料形態與傳統網際網路差異較大,生物製藥資料中很多是圖資料,而傳統網際網路主要以網路資料、人的行為資料為主。

在生物製藥領域,如果想對一張圖結構資料進行預測,或者對生成的小分子、大分子等生物序列比對,就需要各種各樣圖資料模型和VAE模型,甚至還要基於VAE模型學習小分子表徵,進行小分子搜尋和最佳化。

除了預測結構和功能外,AI在小分子性質最佳化上也有很多應用,例如已知一個小分子是潛在藥物,利用AI更高效合成這些小分子,這就涉及到AI模型和博弈數搜尋的結合。

目前,AI在小分子、大分子的應用已經非常完善,AlphaFold2本身就是非常複雜的AI模型。

百圖生科首席AI科學家宋樂:AI,幫助製藥人逃逸“雙十”怪圈


第三個案例,預測RNA二級結構摺疊,透過RNA序列來預測結構。

我認為RNA藥物未來可能是AI製藥非常好的應用方向。

這是RNA二級結構預測演示,先輸入RNA序列,如果需要預測RNA結構。就要在RNA 序列遠端位點摺疊,使空間上比較接近,位點接近程度用接觸圖表徵。

百圖生科首席AI科學家宋樂:AI,幫助製藥人逃逸“雙十”怪圈


AI模型可以在其中基於序列輸入預測接觸圖,目前最好的手段就是深度學習,它的完善程度甚至超越了一些計算機視覺類模型。

用AI分析這樣的資料,首先需要對序列分析,例如可以透過自然語言處理模型表徵生物學序列。

這時,Transformer模型預測的是2D的結果,如果要生成影象資料,還需要做卷積神經網路產生特徵,再預測接觸圖。

而且還要考慮結構的限制,AlphaFold 2就是採用類似的策略,這相比傳統模型確實有巨大提高。

百圖生科首席AI科學家宋樂:AI,幫助製藥人逃逸“雙十”怪圈


實驗和AI模型閉環情況下,除了基因表達資料、蛋白質表達資料之外,AI還可以解決有細胞影象的資料。

細胞影象資料影象可能有六個頻道熒光影象,如何基於熒光影象,描述出微妙的細胞狀態變化,就需要做很多模型開發和設計。

此外,AI還可以提升一些資訊含量比較高的實驗的效率。

第四個案例,有效打標籤。這不止是AI模型問題,也是系統設計的問題,而且也需要專家知識。

往往一開始只能獲得少量精標籤,訓練一個尚可的模型。

但是如果讓這個模型變成更準確的模型,就需要閉環的系統,讓AI模型對大量沒有標籤的影象打標籤,並呈現給無專業背景篩選,再給專家進行精標籤;精標籤打完後,再回流到AI模型更新,進行下一環。

整個過程如果在閉環情況下,就更有可能在少量精標籤情況下,讓模型繼續對大量沒有精標籤的影象打標籤。

此外,AI還可以輸出分割標準,以及選擇什麼樣圖片打標籤,在各個環節都有很多可以做東西,有很多可以提高的空間。

百圖生科首席AI科學家宋樂:AI,幫助製藥人逃逸“雙十”怪圈


最後總結一下,我們目前面臨的都還是非常複雜的問題,即使有很多觀測手段,收集到大量資料,有如此多的AI模型,也還是杯水車薪。

未來,如何把AI模型、專家知識和實驗手段結合在一起,還需要交叉學科的團隊一起努力,希望感興趣的同學加入這個領域,把生物計算交叉學科研究做得更好。

百圖生科首席AI科學家宋樂:AI,幫助製藥人逃逸“雙十”怪圈


這是今天我想講的就是以上這些,如果感興趣,額外的資訊可以關注我們公司的公眾號並訪問我們的網站。謝謝大家!

分類: 家居
時間: 2021-12-30

相關文章

衛生間裝修時跟風的“網紅設計”,入住半年發現全是雞肋,別效仿

衛生間裝修時跟風的“網紅設計”,入住半年發現全是雞肋,別效仿
衛生間裝修時跟風的"網紅設計",入住半年發現全是雞肋,別效仿 在網路如此發達的今天,從網上獲取資訊已經成了一種習慣,就比如裝修前我們會從各種平臺上去關注學習關於裝修和設計的內容. ...

越來越多的人喜歡“偽精緻”,本就普通家庭,何必跟風網紅設計?

越來越多的人喜歡“偽精緻”,本就普通家庭,何必跟風網紅設計?
網路‬時代‬,各種‬各樣家居‬美照把我們看得‬眼花‬撩亂:如果‬在‬裝修‬房子‬的時候沒有‬一點‬辨別‬"是‬與‬非"的‬能力盲目跟風‬,很‬容易‬就會讓‬我們‬在‬裝修‬房子‬的 ...

吐槽整理無數人跟風的網紅設計,華而不實,全都是雞肋

吐槽整理無數人跟風的網紅設計,華而不實,全都是雞肋
現在新房裝修很多人都開始結合網紅設計,網路上有各種網紅,推薦的裝修設計,家居類的產品.看上去好看實用,而且介紹的功能也非常的前衛.但是就因為好奇,沒有見過這一類的設計,導致很多人都上當.自家也跟風去裝 ...

第二次裝修,再也不踩這4個“網紅”設計的坑,廚房乾淨又清爽

第二次裝修,再也不踩這4個“網紅”設計的坑,廚房乾淨又清爽
裝修總是會出現各種各樣的問題,做再多的攻略,也比不上實際的一次裝修,特別是廚房的設計,我第一次裝修時,就鬧出不小的笑話. 如今幾年過去了,給廚房再次裝修,我發誓再也不踩這4個"網紅" ...

別被“網紅家居”帶偏了,有些設計看似“高大上”,實際華而不實

別被“網紅家居”帶偏了,有些設計看似“高大上”,實際華而不實
文案編輯:老曾 網路時代,讓我們足不出戶就可以欣賞到各式各樣的家居美照:但是也是一把雙刃劍,如果沒有一雙辨別"是與非"的能力,就很容易被一些"網紅家居"美照給帶 ...

德國49歲阿姨,拒絕“網紅家裝設計”,全屋簡單樸實,圈粉無數

德國49歲阿姨,拒絕“網紅家裝設計”,全屋簡單樸實,圈粉無數
隨著社會的發展,各種好看.精緻的產品層出不窮,很多人會陷入這樣一個牢籠中,即無限購買慾.但我並不認為一味的購買,推崇新產品.新事物,就是會生活,這也是我喜歡這位德國家的原因所在.她家,沒有豪華的裝飾, ...

22歲網紅韓安冉的開掛人生:已結過3次婚,生孩子也要全程直播

22歲網紅韓安冉的開掛人生:已結過3次婚,生孩子也要全程直播
韓安冉在16歲的時候就已經走進了大眾的視野,當時的她只是一個沉迷整形的叛逆少女. 韓安冉因為過度執著於整形而來到了<變形記>,隨後她憑藉著節目給自己帶來的熱度和光環,躋身網紅界. 今年韓安 ...

初秋的青島,以愛之名,打卡15個網紅景點,看見青島的每一種生活

初秋的青島,以愛之名,打卡15個網紅景點,看見青島的每一種生活
青春.自由.文藝.小資.愛情,每一個字眼跳進眼裡,都讓我不由自主想到青島. 第一次來青島,就對這座海濱城市無比的愛,青島是一個有故事的城市,這座青春之城既有小資浪漫的一面,也是厚重滄桑的一面,我用四天 ...

“轉型失敗”的馮提莫,從“一姐”到“小網紅”,她經歷了什麼?

“轉型失敗”的馮提莫,從“一姐”到“小網紅”,她經歷了什麼?
導語:說起馮提莫這位網紅,應該有很多讀者都有著一定的印象.當年馮提莫出名的時候,甚至在網路上的人氣超越了一部分明星,網紅做到這個份上,已經可以說是非常成功的了,但可惜的是,最終她還是被時代" ...

裝修翻車現場:網紅裝修設計看著好看,入住後才發現“處處是坑”

裝修翻車現場:網紅裝修設計看著好看,入住後才發現“處處是坑”
在裝修的過程中,我們對於網紅的裝修設計,或多或少都會抱有一些幻想,畢竟從圖片看上,他們的設計確實做得相當簡約,可問題也隨之出現了,簡約的設計風格,往往只有入住之後才會發現裡面"處處是坑&qu ...

網紅植物“七葉蓮”,別被名字騙了,市場上很多,價格很低廉

網紅植物“七葉蓮”,別被名字騙了,市場上很多,價格很低廉
最近網上又有一款比較火的網紅植物,叫做"七葉蓮",價格不是很便宜,說它藥用價值非常的高,養在家中非常的棒,但是這種七葉蓮好多人都被誤解以為是七葉一枝花,七葉一枝花它並不是我們現在所 ...

被網紅帶偏的家居設計,看似“高大上”,實際很雞肋,別再跟風啦

被網紅帶偏的家居設計,看似“高大上”,實際很雞肋,別再跟風啦
就在這幾年,越來越多的網紅冒出來,可謂是魚龍混雜,時不時為了流量啥的,就過度吹捧一些家居設計,造成很多網友盲目跟風,導致現實中很有朋友啪啪打臉. 本期為大家盤點那些被網紅帶偏的家居設計,看似個個&qu ...

每日擼報:中國網紅收入排行榜PDD上榜!Perkz評世界賽中單

每日擼報:中國網紅收入排行榜PDD上榜!Perkz評世界賽中單
中國網紅收入排行榜:PDD上榜 今日世界著名財經雜誌<財富>釋出近三年的中國網紅收入排行榜,前二總和收入過百億而電競圈共六人上榜. 電商帶貨"雙雄"薇婭和李佳琪分別以5 ...

網紅打卡地的盡頭,是照騙

網紅打卡地的盡頭,是照騙
如今,幾乎所有城市的旅遊行業,都在瘋狂參與一場追逐"網紅打卡地"的比賽. 於是,各路點評.分享App上的旅遊筆記,便成了現代年輕人制訂旅遊計劃的首選參考.不過,包裝在"親 ...

別再盲目跟風網紅裝修了,除了拍照好看,入住後就知道有多災難

別再盲目跟風網紅裝修了,除了拍照好看,入住後就知道有多災難
講真,跟風網紅買一些小東西還好,不喜歡大不了不要了,頂多費點錢,但裝修這事,裝好了再想改,就不光是錢的事兒了. 很多網紅分享的裝修案例,純粹是為了拍照好看,不講究一點實用性,如果我們不瞭解,盲目跟風, ...

不顧全家人的反對,添置了這些“網紅新品”,沒想到越用越舒服

不顧全家人的反對,添置了這些“網紅新品”,沒想到越用越舒服
現在我們生活在網路發達的時代,大家購買東西的時候都不需要再出門了,只需要動動手指頭,物品就能夠送到家,這樣的方式雖然方便了我們的生活,但並沒有得到保障,因為我們是透過螢幕去看到的,並不知道它實際是什麼 ...

剛裝修好的房子,被一堆“網紅”家居用品給毀了

剛裝修好的房子,被一堆“網紅”家居用品給毀了
很多人不管是裝修還是選購用品,都把顏值放在第一位,其實這並沒有什麼錯,顏值即正道,好看是必須的.但對於家居生活來說,實用性同樣也很重要,而不是隻停留在表面上的精緻. 就個人踩坑的經驗來講,儘量避免追求 ...

家裝界“網紅”推拉門,以空間魔法串聯一家子輕暖日常

家裝界“網紅”推拉門,以空間魔法串聯一家子輕暖日常
很多人遇見了帝奧斯,便鍾情於它美感與實用兼具的設計理念,滿足於他們對於理想家的未來想象.風頭正盛的家裝"網紅"--L型極窄聯動推拉門,透過空間的魔法,讓整個家渾然天成,成為屋主最嚮 ...

佛山斥資16億打造的酒店,已成網紅打卡點,邂逅雲端上的法式浪漫

佛山斥資16億打造的酒店,已成網紅打卡點,邂逅雲端上的法式浪漫
法國盧浮宮位是世界上最著名.最大的藝術寶庫之一,他金碧輝煌的宮殿式建築重現了法國文藝復興時期的輝煌,是世界著名的藝術殿堂. 樂玩君最近打卡了佛山新亞網紅·佛山索菲特酒店,酒店是全佛山市最高的建築,裡面 ...

1200AH鋰電800W太陽能,配置到頭!H500輕卡房車“網紅1號”詳解

1200AH鋰電800W太陽能,配置到頭!H500輕卡房車“網紅1號”詳解
藍牌C本即可駕駛的輕卡房車,可能是當下最熱門的車型之一.而這種型別的產品市面並不多!最起碼沒到依維柯或者上汽大通底盤那般千篇一律,所以這類輕卡底盤房車每次有新品推出,都引得老車友矚目. 今天要為大家介 ...