sponsored links

公開催化劑挑戰賽冠軍模型、通用AI分子模擬庫Graphormer開源

編者按:微軟亞洲研究院創新提出的可應用於圖結構資料的 Graphormer 模型近日迎來重大升級!研究員們將此前開源的 Graphormer 升級為基於人工智慧的分子模擬通用工具包。關注分子模擬領域的科研人員和演算法工程師們可透過新版 Graphormer 工具包更好地對材料發現、藥物發現等應用中的重要問題進行最前沿的深度學習模型與演算法建模。在全新升級的 Graphormer 模型助力下,微軟亞洲研究院的研究員們在剛剛結束的公開催化劑挑戰賽中也取得了第一名的佳績。一起來看看此次升級都帶來了哪些更新吧!


Graphormer 模型是微軟亞洲研究院提出的新一代對圖(Graph)資料進行建模的深度學習模型(典型的圖資料包括分子化學式、社交網路等等)。相比於上一代傳統的圖神經網路(Graph Neural Network),Graphormer 模型具有更強大的模型表達能力、更高效捕捉圖結構資訊的能力以及可拓展性的更大潛力。在近期舉辦的 KDD Cup 2021 上,Graphormer 模型在 OGB-LSC 圖預測賽道上擊敗了全球包括 DeepMind 在內的多個技術實力強勁的公司和研究機構,奪得冠軍。

近年來,基於人工智慧演算法的分子性質預測與模擬在材料科學、生物製藥等領域都有著極其重要的應用。然而,在機器學習的開源社群中卻缺少支援前沿分子模擬深度學習的演算法與模型以及可方便使用的工具包。為了彌補領域內這一空白,微軟亞洲研究院的研究員們在過去一段時間內不斷迭代更新,將此前開源的 Graphormer 升級為基於人工智慧的分子模擬通用工具包,以幫助科研人員和演算法工程師更好地運用最先進的機器學習演算法進行分子模擬、分子性質預測、分子生成等任務。此次重大升級包括了最前沿的演算法、更易用的預訓練模型、更靈活的使用介面、更高效的架構與更完善的文件等。無論是科研人員,還是演算法工程師,Graphormer 都能在 AI 分子模擬上助你一臂之力。

公開催化劑挑戰賽冠軍模型、通用AI分子模擬庫Graphormer開源

GitHub 地址:

https://github.com/microsoft/Graphormer

專案主頁:

https://www.microsoft.com/en-us/research/project/graphormer/

公開催化劑挑戰賽冠軍模型、通用AI分子模擬庫Graphormer開源

Graphormer 模型再升級,助力奪魁公開催化劑挑戰賽

剛剛結束的公開催化劑挑戰賽(Open Catalyst Challenge)由 Facebook AI 研究院、卡耐基梅隆大學聯合機器學習頂級會議 NeurIPS 共同舉辦,旨在使用人工智慧演算法對新催化劑材料進行建模與發現,並助力解決新能源儲存、氣候變化等問題。

催化劑的發現和最佳化是解決許多社會和能源挑戰的關鍵,包括太陽能燃料合成、長期儲能和可再生肥料生產等。新的催化劑結構可以使用基於量子化學的分子與化學反應模擬(如密度泛函理論等)進行篩選與評估。然而,過於高昂的計算開銷與時間開銷不僅限制了可模擬的通量與規模,也大大限制了整個領域的發展。為此,使用機器學習演算法為分子和反應模擬提供高效的近似正逐漸成為催化劑發現中新的趨勢

儘管催化界為將機器學習模型應用於計算催化劑的發現過程做出了相當大地努力,但構建可以泛化表面元素組成和吸附物特性的模型仍然是一個開放的挑戰。為了解決該挑戰並推動催化劑領域的發展,本次公開催化劑挑戰賽要求參賽隊伍開發機器學習演算法模擬超過66萬個密度泛函理論計算的催化劑-吸附物反應系統(超過1億4千萬個結構-能量估計),其中每個系統要模擬吸附物從初始狀態到鬆弛狀態(能量最低)過程中的結構與能量。



催化劑與吸附物反應鬆弛過程系統示意圖

由於該公開催化劑挑戰賽具有重大的科研意義,賽題富有且挑戰性,資料集規模也十分龐大,因此吸引了包括 DeepMind、FAIR、CMU 等在內的眾多科研機構與高校實驗室的關注和參與。在 NeurIPS 2021 大會上,競賽主辦方公佈了 Direct Track(直接預測鬆弛能量)的成績:微軟亞洲研究院達到了0.547eV的絕對誤差,以較大優勢奪冠。賽事的演算法效能分析顯示,對於多吸附物的複雜系統,Graphormer 模型能以89%的準確率預測最低能量系統,可以節省至少50%的密度泛函理論計算開銷。

公開催化劑挑戰賽冠軍模型、通用AI分子模擬庫Graphormer開源


Direct Track 公開(左)與非公開(右)測試集排行榜:微軟亞洲研究院的 Graphormer 模型均取得第一名

為了持續提升 Graphormer 模型的效能,微軟亞洲研究院的研究員們對模型進行了升級,包括支援對 3D 分子建模以及保持等變性的輔助任務等。

此前,為了更好的捕捉 2D 圖中的結構資訊,Graphormer 模型使用最短路距離作為空間編碼刻畫節點之間相互的空間位置關係;使用度資訊作為中心性編碼刻畫每個節點的結構重要性。然而 3D 分子中不存在化學鍵資訊,因此整個系統可視為由所有原子組成的全連線圖,所以研究員們使用了高斯核函式對節點之間的歐式距離進行了編碼作為空間編碼,並對每個節點的空間編碼進行求和,從而得到刻畫節點重要性的中心性編碼。

除了讓 Graphormer 模型直接預測系統鬆弛狀態下的能量,研究員們還為演算法設計了輔助任務:預測每個原子從初始狀態到鬆弛狀態的座標位移。在分子動力學任務中常常需要預測原子受力情況或座標位移等,因此模型的輸出需要對系統的旋轉平移等保持等變性。為此,研究員們為 Graphormer 模型設計了一個特殊的 3D 注意力層,使圖中目標節點對源節點的作用可以投影到 x,y,z 三軸上,從而讓模型輸出達到等變的效果。

公開催化劑挑戰賽冠軍模型、通用AI分子模擬庫Graphormer開源



公開催化劑挑戰賽中奪魁的 Graphormer-3D 模型

最新的開源 Graphormer 工具包中已經包括了此次公開催化劑挑戰賽所使用的全部模型、訓練推理程式碼與資料處理指令碼等,希望相關領域的科研人員與演算法工程師們可以方便地將 Graphormer 應用到分子動力學等任務中,助力人工智慧演算法在材料發現、生物製藥等領域的進展。

公開催化劑挑戰賽冠軍模型、通用AI分子模擬庫Graphormer開源

開源推動交叉領域的前沿研究與應用

當下,人工智慧演算法與自然科學的研究正在加速交叉融合,微軟亞洲研究院也在生物、材料、環境科學等多個領域的重要問題中取得了突破性進展。作為微軟亞洲研究院在人工智慧與自然科學交叉領域的第一個開源工具包,Graphormer 希望推進人工智慧與分子科學交叉領域的重要前沿研究與應用,如新型儲能材料發現、藥物發現等。除了前沿的演算法升級,Graphormer 還提供了在不同資料集上訓練的強大預訓練模型。

眾所周知,分子的精確物化性質或藥化性質往往需要在實驗室中測定,或臨床試驗中獲得,因此高質量的資料往往十分缺乏,導致一些前沿的深度學習模型無法發揮其強大的表達能力。而有了強大的預訓練模型,科研人員們往往只需要在自己特定的任務上使用非常少的資料對模型進行微調,即可得到效能強大的深度學習模型。例如在此次升級後,工具包中提供了在 PCQM4M 資料集上預訓練好的 Graphormer 模型,PCQM4M 資料集包含超過380萬個分子的量子化學屬性,可以讓預訓練 Graphormer 模型學到豐富的化學知識,並具有很好的遷移性。比如,當將在該資料集上預訓練的 Graphormer 模型遷移到生物測定任務(如 OGBG-PCBA 等資料集)上時,可以獲得遠超上一代圖神經網路的效能與效果。

此外,Graphormer 工具包目前支援 PYG、DGL、OGB 等多種主流圖工具包與資料庫,方便科研人員們快速在基準資料集或私有的特定資料上進行演算法開發與驗證。相比於上一版本,升級後的 Graphormer 效率更高,並且可提供高效能的大規模並行訓練以及靈活的自定義模型演算法。除了豐富的介面、強大的前沿演算法與預訓練模型以外,本次更新的 Graphormer 工具包還完善了文件支援,豐富的樣例程式也可幫助使用者們更容易理解、快速上手。

在未來,除了分子性質預測、分子動力學等,Graphormer 工具包還將支援多種科研與工業界的常見應用,如藥物分子與蛋白質相互作用、化學反應預測(逆合成)、分子生成、大體量分子(聚合物、蛋白質)模擬等等。大量的公開資料集、業界基準以及統一的評價標準將能夠幫助科研人員與企業使用者省去不必要的麻煩,專心於演算法或應用。

一直以來 Graphormer 都得到了社群成員和使用者的積極反饋。現在 Graphormer 的更新非常活躍,未來也將有更多功能開放出來,歡迎關心分子建模相關問題的使用者關注並使用微軟亞洲研究院 Graphormer 工具包。也希望透過更多的交流和分享可以助力分子建模領域形成大規模的良性迴圈。


Graphormer

GitHub地址:

https://github.com/microsoft/Graphormer

文件地址:

https://graphormer.readthedocs.io/en/latest/

專案主頁:

https://www.microsoft.com/en-us/research/project/graphormer/

分類: 數碼
時間: 2021-12-24

相關文章

Apple Watch Series 7 正式開售,2999 元起

Apple Watch Series 7 正式開售,2999 元起
Apple Watch Series 7 正式開售 在今年 9 月的特別活動中,Apple Watch Series 7 與新款 iPhone.iPad 一同登臺亮相,並於今日晚 8 點開始接受訂購, ...

iPhone 13系列正式開售 京東免費1年AppleCare+等你來搶

iPhone 13系列正式開售 京東免費1年AppleCare+等你來搶
隨著iPhone 13系列.iPad mini 6.iPad 9等Apple新品正式發售,不出意外的再度掀起了果粉們的搶購熱潮.京東在第一時間同步開售的同時,還繼續為果粉帶來換新福利:9月26日前在A ...

大片世界 在此成真 | 北京環球度假區今日正式開園 / TJAD同濟設計

大片世界 在此成真 | 北京環球度假區今日正式開園 / TJAD同濟設計
2021年9月20日中午12時,由同濟設計集團參與設計的北京環球度假區正式開園.作為世界第五個.亞洲第三個.中國第一個影城主題公園從建設之初就備受矚目,自9月1日試執行以來就"刷屏" ...

任天堂Switch OLED主機今起正式開售:它的配件,你備好了嗎?

任天堂Switch OLED主機今起正式開售:它的配件,你備好了嗎?
任天堂OLED版Switch於今日正式發售. Switch OLED主機採用了尺寸更大的7英寸OLED螢幕,內建儲存空間升級至64GB,售價349.99美元,港版同步發售.除了上述兩個硬體方面的升級以 ...

vivo放狠招,256GB+IP68防水+自研晶片,頂尖旗艦一天後正式開售

vivo放狠招,256GB+IP68防水+自研晶片,頂尖旗艦一天後正式開售
手機到底需不需要防水功能一直都存在著爭議,雖然手機能夠支援防水固然是件好事,但是防水功能的增加也會讓手機更貴,而且即使手機支援了防水,一旦進水也是不保修的,所以在這種情況下,國內許多消費者在購買手機的 ...

vivo X70 Pro新機正式開售,vivo X60淪為白菜機悲慘讓路

vivo X70 Pro新機正式開售,vivo X60淪為白菜機悲慘讓路
前幾天,vivo X家族的新成員--X70系列正式釋出,X70/X70 Pro/X70 Pro三種機型上市. 經過幾天前的發售,vivo X70 Pro.vivo X70 Pro兩種機型將於今天發售, ...

小米米家四門高階冰箱今日開售 到手價5499元

小米米家四門高階冰箱今日開售 到手價5499元
本月8日釋出的小米米家四門冰箱今日正式開售,釋出價5999元,首發到手優惠500元,到手僅為5499元. 產品方面,小米米家四門冰箱可以為使用者提供萬元級的配置,新品除了擁有高能正負離子群主動殺菌外, ...

華為P50正式上架,本月底開售

華為P50正式上架,本月底開售
近日,華為 P50已經在天貓.京東等平臺上架,將於9月29日10:08正式開售,售價4488元起. 據悉,華為 P50 全系搭載高通驍龍888 4G晶片,而華為P50 Pro則搭載高通驍龍888 4G ...

最高加價高達3000元!經銷商已開售iPhone13,不加錢買不到現貨

最高加價高達3000元!經銷商已開售iPhone13,不加錢買不到現貨
iPhone 13Promax 1TB遠峰藍色加價3000元才有現貨? 距離蘋果正式開售iPhone13系列的手機還有一天的時間,經銷商渠道率先開售了這款新品,並且推送了今日的iPhone13現貨價格 ...

蘋果iphone13開售被秒光,真有那麼香嗎?別急,先看完本文

蘋果iphone13開售被秒光,真有那麼香嗎?別急,先看完本文
2021年9月17日晚間,新款iphone13系列正式開售,使用者直接把官網買崩了,iphone13首批售罄連夜補貨,新手機熱度遠遠大於預期.iphone13真的有那麼香嗎?值得買嗎?iphone13 ...

官方直降1100元,iPhone13即將正式開售,舊款蘋果手機已加速讓路

官方直降1100元,iPhone13即將正式開售,舊款蘋果手機已加速讓路
每年蘋果新機發佈會即將舉辦之前,蘋果旗下的iPhone手機銷量都會迎來一陣疲軟期,因為消費者如果不是很急著入手新機的話,都會願意等一等蘋果iPhone新機正式釋出再做決定,即使新機升級不大,蘋果舊款i ...

瘋狂!1分鐘售罄!今天,北京環球影城正式開園!遊客兩人花6000元,這類公園到底有多“吸金”

瘋狂!1分鐘售罄!今天,北京環球影城正式開園!遊客兩人花6000元,這類公園到底有多“吸金”
來源:央視財經 北京環球影城今天(20日)正式開園,不過門票在正式開售1分鐘內,就全部售罄.如此吸引眼球的北京環球影城,到底有多吸金?記者實地探訪發現,在園區一天,門票.餐飲加上紀念品消費,花費動輒超 ...

北京環球影城正式開園,門票一分鐘售罄,遊客倆花6000

北京環球影城正式開園,門票一分鐘售罄,遊客倆花6000
昨日9月20起北京環球影城正式開園,不過門票在正式開售1分鐘內,就全部售罄,更有官方購票APP曾一度癱瘓,遊客兩人花6000 目前環球影城是採用4級票價,最低是418元,最貴是748元.如果在開園的這 ...

打臉!iPhone13開售,國內使用者把官網買崩,粉色版六成被男性購買

打臉!iPhone13開售,國內使用者把官網買崩,粉色版六成被男性購買
9月17日20點,蘋果新款iPhone 13系列手機正式開售,國內使用者直接把官網買崩,iPhone13首批售罄連夜補貨,話題幾度衝上熱搜. 與中國市場表現強勁相反,在股市上蘋果的市值卻蒸發了3000 ...

蘋果13開售,上百人排隊購買,黃牛加價銷售

蘋果13開售,上百人排隊購買,黃牛加價銷售
9月24日,蘋果13開售首日,在四川成都太古裡蘋果門店 上百人爭相排隊體驗,店內人潮湧動,擁擠不堪 據訊息透露,有黃牛甚至在店門口加價300至900元轉賣新機 在9月17日20點iPhone 13系列 ...

蘋果13即將開售,搶首發除了炫耀又有什麼用?也太現實了吧

蘋果13即將開售,搶首發除了炫耀又有什麼用?也太現實了吧
不知道從什麼時候開始,小米要搶.華為要搶.蘋果要搶,最近蘋果13釋出,預約瞬間超過了百萬,可以想象,實體店開售門前照樣有人提前幾個小時甚至提前一天搭帳篷蹲守,一部手機而已,除非是數碼博主開箱,不知道搶 ...

量血壓是左手還是右手?醫生提醒:在家測血壓做好這3點才準確

量血壓是左手還是右手?醫生提醒:在家測血壓做好這3點才準確
"醫生,你說我平時在家測血壓的話,是量左手還是右手呀?" "量哪隻手才能更準確呀?會不會有誤差呀?" 前兩天聽到一個患者來醫院檢查的時候,向我提出了上述這樣的疑 ...

iPhone13歧視亞洲人?國內開售之後,依舊供不應求

iPhone13歧視亞洲人?國內開售之後,依舊供不應求
在蘋果官方網站關於iPhone13的宣傳中,有一張亞洲人的照片,這個照片的特點是--眯眯眼.單眼皮.黝黑面板:需要注意的是,眯眯眼是對亞洲人的羞辱動作,同時也是對亞洲人的歧視:蘋果在iPhone13的 ...

北京環球度假區正式開園

北京環球度假區正式開園
當日,北京環球度假區正式開園,包括北京環球影城主題公園.兩家度假酒店.北京環球城市大道.據瞭解,北京環球度假區是世界第五個.亞洲第三個環球主題公園. 9月20日,遊客(右)進入北京環球影城主題公園. ...

iPhone13剛開售,iPhone14Pro渲染圖就曝光,劉海充電口都沒了

iPhone13剛開售,iPhone14Pro渲染圖就曝光,劉海充電口都沒了
要說今年期望值最高的手機,莫過於iPhone13系列,如今iPhone13已經開售,雖然iPhone13的升級幅度並不大,但依然深受使用者歡迎.主要是因為iPhone13的價效比確實相當高,128GB ...