sponsored links

NLP新里程碑!清華姚班畢業生髮布KEAR:首次常識問答超越人類

編輯:LRS 好睏

【新智元導讀】以後再也不能說人類比AI還懂常識了!最近由微軟黃學東坐鎮,清華姚班畢業生髮布了一個新系統KEAR,成功刷榜各大常識問答排行榜,常識問答效能首次超越人類,甚至非英文的常識他也懂!

AI模型一直為人詬病的一點就是隻會「死學習」,只能根據給定的訓練樣本來進行預測,稍微問一點「常識性」的問題它都回答不了。

比如你問GPT-3:太陽有幾個眼睛?

它會毫不猶豫的告訴你:當然是一個眼睛!

NLP新里程碑!清華姚班畢業生髮布KEAR:首次常識問答超越人類

雖然常識資訊沒有體現在輸入文字中,但如果不懂常識的話,那回答只能是驢唇不對馬嘴。

為了解決這類常識性錯誤,研究人員藉助ConceptNet建立了一個專門針對常識問答的資料集CommonsenseQA,要求模型必須得了解常識才能夠正確回答問題。

NLP新里程碑!清華姚班畢業生髮布KEAR:首次常識問答超越人類

每個問題包含五個候選答案,其中有兩個是干擾項,對AI模型來說屬於是難上加難了。

例如給定一個問題:你的狗喜歡吃什麼?(What is a treat that your dog will enjoy?)

候選答案可能是沙拉(salad)、撫摸(petted)、喜愛(affection)、骨頭(bone)、關心(lots of attention)等。人在與狗交往的過程中,可以瞭解到大部分狗都喜歡吃骨頭,從而推理出你的狗在候選答案中也更傾向於骨頭,但AI模型並不懂。

所以想要正確回答這個問題,必須要懂得如何利用外部知識。

然後CommonsenseQA的作者拿了一個當時橫掃各大排行榜的模型BERT-LARGE來做測試,結果慘不忍睹,準確率只有55.9%,而人類的回答準確率已經達到了88.9%了。

NLP新里程碑!清華姚班畢業生髮布KEAR:首次常識問答超越人類

時間來到三年後,最近來自微軟的華人團隊發表了一篇論文,提出了一個KEAR(Knowledge External Attention for commonsense Reasoning)系統,將CommonsenseQA常識問答的效能抬到了新高度,準確率達到89.4%,成功超越人類,堪稱AI常識領域的里程碑模型了。

NLP新里程碑!清華姚班畢業生髮布KEAR:首次常識問答超越人類

相比傳統AI模型需要大規模資料來訓練,這篇論文提出了一種外部注意力機制(external attention mechanism)來增強Transformer架構,能夠把外部知識資訊整合到預測的過程中,從而減少了模型對大引數量的需求,讓AI系統更加民主化(democratization),也就是說可以降低AI模型研究的門檻,不用從老黃那買特別多的顯示卡,也能實現SOTA效能。

大體來說,KEAR模型在回答「你的狗喜歡吃什麼」這個問題的時候,它會首先從ConceptNet實體鏈中檢索出「狗— desires — petted, affection, bone, lots of attention」,這樣就排除了一個錯誤答案沙拉。

然後KEAR會從Wiktionary中檢索出骨頭的定義:構成大多數脊椎動物骨架的複合材料(a composite material making up the skeleton of most vertebrates);

從CommonsenseQA資料集中的訓練資料中檢索出「狗喜歡吃什麼?骨頭」(What do dogs like to eat? bones)。

再將檢索到的知識和輸入的知識進行級聯後,KEAR將其作為DeBERTa模型的輸入,最後可以推理出正確答案:骨頭!

NLP新里程碑!清華姚班畢業生髮布KEAR:首次常識問答超越人類

可以看到,對於人類來說最簡單的一個問題,AI模型要完成卻需要大量的外部資訊才能正確回答。

由於CommonsenseQA只是英文常識問答的資料,文中還探索了一下其他語言的常識推理是否依然有效。

研究人員首先將非英語問題翻譯成英語,然後在英語的語料資料中檢索知識,然後將知識文字翻譯成源語言,經過外部注意力機制後再翻譯獲得答案,即翻譯-檢索-翻譯(TRT)。

結果也是在X-CSR基準上的兩個任務X-CODAH和X-CSQA都取得了第一名。

NLP新里程碑!清華姚班畢業生髮布KEAR:首次常識問答超越人類

不止於自注意力

時至今日,大部分AI模型基本都在源文字上使用自注意力機制,透過把大量的資料餵給模型進行訓練,從而使模型記住輸入的文字。

雖然Transformer的效果很好,但缺點也很明顯:

  1. 時間和空間複雜度太高,需要大量的顯示卡和視訊記憶體
  2. 資料量不夠的情況下,Transformer表現不夠好

另一方面,Transformer本質上還是黑盒模型,沒辦法讓他像人類一樣進行文字理解和推理,知道AI為什麼產生這樣的預測是很重要的,KERA透過利用知識圖譜、字典和公開可用的機器學習資料的常識性知識,能夠一定程度地反應答案的來源及模型推理過程。

NLP新里程碑!清華姚班畢業生髮布KEAR:首次常識問答超越人類

外部注意力的實現方法也很簡單,將輸入(input)和知識(knowledge)級聯起來作為新的輸入,然後將整體作為H0經過自注意力機制即可。

NLP新里程碑!清華姚班畢業生髮布KEAR:首次常識問答超越人類

其中K(nowledge)的來源包括知識圖譜ConceptNet, 字典和訓練資料。

可以看到,自注意力和外部注意力的主要區別就是輸入是否只來源於輸入文字,即透過向外部注意力機制提供不同來源的相關背景和知識,包括知識圖譜、字典、語料庫和其他語言模型的輸出,然後讓模型同時對輸入進行自注意力和對知識進行外部注意力,就能達到引入外部知識的效果。

引入的外部資訊以符號(symbol)的方式儲存,如純文字或知識圖譜條目,從而能夠提升Transformer在語言理解方面的能力。

NLP新里程碑!清華姚班畢業生髮布KEAR:首次常識問答超越人類

並且KEAR使用的輸入和知識的文字級聯不會對Transformer模型結構產生任何改變,使現有的系統可以很容易地使用外部注意力。

因為世界上的知識也是在動態變化的,所以外部注意力的另一個好處是,使用者可以很容易地更新知識源來改變模型的預測輸出。

透過引入最新的常識,例如將線上更新的知識圖譜輸入到模型中,可以使模型的決策過程變得更加透明和可解釋。

而用多模組聯合最佳化、加上外注意力引入知識庫也是微軟人工智慧認知服務提質量的核心方向。

作者介紹

文章的第一作者是徐一翀,本科畢業於清華大學姚班,於卡內基梅隆大學取得博士學位,主要研究方向為互動式機器學習,自然語言處理和深度學習。目前是微軟AI Cognitive Services研究組的高階研究員。

NLP新里程碑!清華姚班畢業生髮布KEAR:首次常識問答超越人類

朱晨光是微軟認知服務研究組的首席研究負責人。他領導知識和語言團隊,從事文字總結、知識圖譜和麵向任務的對話方面的研發工作。他於2016年在斯坦福大學獲得計算機科學博士學位和統計學碩士學位,在此之前於清華大學姚班獲得計算機科學學士學位。

NLP新里程碑!清華姚班畢業生髮布KEAR:首次常識問答超越人類

黃學東是微軟AI認知服務工程和研究團隊的領導人,IEEE/ACM院士(IEEE/ACM Fellow) ,微軟首位「華人全球技術院士」、微軟首席語音科學家、微軟雲計算與人工智慧事業部認知服務團隊全球技術院士/全球人工智慧首席技術官。他先後獲得湖南大學學士學位,清華大學碩士學位和英國愛丁堡大學博士學位。

NLP新里程碑!清華姚班畢業生髮布KEAR:首次常識問答超越人類

參考資料:

https://arxiv.org/abs/2112.03254

分類: 健康
時間: 2021-12-29

相關文章

吃飯經常咬腮 可不是饞肉了
平時我們吃飯時,牙齒經常會一不小心咬到腮幫子,有時候甚至會咬出血或血泡來.這時,旁邊的人總開玩笑說:"你這是饞肉了!"咬腮幫是因為饞肉,沒有科學道理.吃東西時牙齒運動,偶爾咬到腮很 ...

吃飯經常咬腮可不是“饞肉”
平時吃飯時,牙齒經常會不小心咬到腮幫子,有時甚至會咬出血來.這時,旁邊會有人開玩笑說:"你這是饞肉了!"這是沒有科學道理的.吃東西時偶爾咬到腮很正常,但長期反覆咬腮幫應該重視. 在 ...

打戲漂亮的古裝男神只服這6位,動作行雲流水不說,儀態還特別好

打戲漂亮的古裝男神只服這6位,動作行雲流水不說,儀態還特別好
隨著影視業的發展,現在每年都會有無數古裝劇與大家見面,但不管是仙俠還是武俠最終核心都變成了戀愛,想要看到打鬥漂亮的場面比較難了.除了劇情統統弱化以戀愛為主,還有一個重要原因是大多數演員不擅長拍打戲,沒 ...

29歲的歐豪:從“快男”到“百億票房先生”,他經歷了啥?

29歲的歐豪:從“快男”到“百億票房先生”,他經歷了啥?
馬思純曾在2019年參加一檔節目的時候,在節目中崩潰大哭,當時的主持人問她有沒有談過戀愛,而馬思純則哭著說,那是一段很幸福的戀愛.節目播出後,一時之間網友將矛頭指向馬思純的前男友歐豪,又從網路上擷取一 ...

深度:科比搶七資料不好勝率卻很高,是他實力不行還是隊友太強?

深度:科比搶七資料不好勝率卻很高,是他實力不行還是隊友太強?
前幾天看到有人發出這個資料--NBA巨星搶七資料如何? 1.勒布朗:場均35+10+6,53% 2.杜蘭特:場均33+7+3,55% 3.庫裡:場均28-6+7,48% 4.哈登:場均27+6-6,4 ...

醫院為什麼要安排男醫生進婦產科,難道不會尷尬嗎?真相來了

醫院為什麼要安排男醫生進婦產科,難道不會尷尬嗎?真相來了
我們中國人的思想還是比較保守的,女性朋友也會格外注意自己的隱私部位,當然在平時,女性朋友也不會隨意與陌生的男性過於親近. 不過很多產婦在產房裡卻遇到了男醫生,對於產婦來說會感覺特別尷尬,不知所措,但是 ...

江華:44歲退圈,53歲賣保險,老婆比他大8歲,26歲兒子當護士

江華:44歲退圈,53歲賣保險,老婆比他大8歲,26歲兒子當護士
一個演員, 被觀眾認可,卻遭同行嫌棄甚至厭惡, 觀眾因為他的美貌傾倒, 同行卻因為他的為人紛紛遠離, 如此兩極分化的江華,到底做了什麼. 老港劇迷,肯定熟悉江華, 他飾演的的角色亦正亦邪, 江華應該是 ...

《咬鼻子》

《咬鼻子》
河南 楊青江 這是北宋年間的故事.傳說徽宗趙佶是個風流皇帝,終日不理朝政.除了吹拉彈唱,吟詩作畫,就 是遊山逛水,尋求長生不老的靈丹妙藥,哪兒道士多就往那兒跑.上行下效,舉國信仰道教成風,和尚們的日子 ...

浮腫僵硬、面部扭曲!這8位動臉的男明星,堪稱“災難現場”

浮腫僵硬、面部扭曲!這8位動臉的男明星,堪稱“災難現場”
娛樂圈是個特殊的圈子,想要在這裡混下去,必須要有超高顏值和好身材,否則便會泯然於眾人,遲早被淘汰. 隨著醫學技術的提高,女明星們紛紛動起來,不停地在臉上折騰,以求永葆青春,貌美如花. 比如鞠婧禕,剛出 ...

一個喜歡咬人的孩子

一個喜歡咬人的孩子
孩子咬人又快又準 "老師!老師!他咬我!"剛到班級,就看到一個女孩子迎面向我撲來,眼睛紅紅的,慌張得手足無措.順向孩子手指的方向,我看到一個四五歲的小男孩,正拿著積木"哐 ...

為什麼說男不養貓,女不養狗?看完漲知識了

為什麼說男不養貓,女不養狗?看完漲知識了
當下年輕人總愛養些小寵物來解悶.聊以慰藉,比如說:小貓.小狗什麼的,但是養寵物有一個說法:就是男不養貓,女不養狗,可能知道這句話的人並不少,至於是什麼原因呢?知道的人就不多了.接下來就讓小編來給大家介 ...

14位香港老牌男神,年輕時個個是大帥哥,40歲後顏值大跌

14位香港老牌男神,年輕時個個是大帥哥,40歲後顏值大跌
前段時間不少人被謝霆鋒,劉德華,苗僑偉,黃宗澤和吳卓羲等人的狀態驚訝到,這群年過40歲,甚至接近60歲的香港男星比女明星還要"凍齡". 但其實不是所有香港男星都保養得這麼好,比如這 ...

臉上長皺紋怎麼辦?建議常吃這些食物,減緩面板老化,人更顯年輕

臉上長皺紋怎麼辦?建議常吃這些食物,減緩面板老化,人更顯年輕
女人的面板過了25歲之後就會逐漸走下坡路,如果不注意補充蛋白質,不注意護膚的話,臉上就會慢慢爬上細紋,時間長了這些細紋會慢慢長成皺紋. 臉上長皺紋也是衰老的表現,為了延緩衰老,讓自己保持年輕態,就要想 ...

它們有個綽號——恐怖咬鯨怪

它們有個綽號——恐怖咬鯨怪
開工第一天,我努力給大家介紹一種別開生面的生物,[雪茄達摩鯊Isistius brasiliensis],它們不大,作為一種鯊魚,大抵也只有50cm左右-但是它們很奇葩,更標準的說,很牛逼--[耶][ ...

高個臉的男明星,我只服這3位!身高175cm卻有一張180cm的臉

高個臉的男明星,我只服這3位!身高175cm卻有一張180cm的臉
有一種長相很佔優勢,叫做:高個子臉. 這種長相在男明星裡很常見,也是大家都喜歡的顏值.高個子臉特點就是,只要看臉,你就會覺得這個人很高. 今天,學姐就盤點了3位擁有"高個子臉"的男 ...

臉上有這4個特徵的女人,屬於天生的“抗老臉”,年紀越大越耐看

臉上有這4個特徵的女人,屬於天生的“抗老臉”,年紀越大越耐看
很多女性都會羨慕娛樂圈的那些明星,會覺著她們比我們普通人老得慢很多,不僅身材好,面板也非常好,很多已經過了4.50歲的明星看起來卻只有30來歲的樣子,令人感到非常的羨慕.有些或許是藉助了一些保養的手段 ...

30歲以後臉部就會開始下垂?25歲凍齡小姐姐的臉部保養秘訣

30歲以後臉部就會開始下垂?25歲凍齡小姐姐的臉部保養秘訣
不知從何時開始,顏值即為正義成為社會性現象,在這個看臉的時代,如果顏值方面有問題,那肯定是一件相當糟心的事情,不管是戀愛.求職還是託人辦事,比起其他面貌姣好之人,多費一番手腳是必然的事情,甚至會遭受區 ...

那些一刀切削骨的明星還好嗎?後遺症一大堆,小方臉成最大贏家

那些一刀切削骨的明星還好嗎?後遺症一大堆,小方臉成最大贏家
娛樂圈裡雲集各種不同風格的帥哥美女,想要在一眾容貌出色的人中出頭,五官漂亮固然重要,可是鏡頭對於臉型也格外挑剔. 因此很多明星都選擇了去削骨. 可是太多明星削錯骨了-- 大家通常說的削骨,就是下頜骨切 ...

民間故事:譚娘:一個在封建家族裡苦苦掙扎的女人

民間故事:譚娘:一個在封建家族裡苦苦掙扎的女人
西峽嶺有一個岑家村,岑姓人家在村裡佔了大半數以上,岑氏家規森嚴,是西峽嶺方圓幾十裡內有名的大家族.咱們今天這個故事的主人翁,就是岑氏家族中一個可憐的女人. 話說岑家村後面的山坡上,孤零零地矗立著一座小 ...

“醜媽媽”醜子岡,不上戰場不扛槍,卻得到毛澤東的尊敬,為何?

“醜媽媽”醜子岡,不上戰場不扛槍,卻得到毛澤東的尊敬,為何?
解放戰爭時期,在延安生活過的人,特別是在戰火硝煙中出生的孩子,無人不知"醜媽媽"的名字,也沒有人會忘記這個名字. "醜媽媽"名叫醜子岡,她長得確實不漂亮.一雙小 ...