sponsored links

降低AI技術應用門檻 全球首個知識增強千億大模型亮相

21世紀經濟報道記者楊清清 北京報道

作為當前人工智慧發展的重要方向,預訓練大模型已成為AI領域的技術新高地。

據不完全統計,目前AI大模型已經吸引了包括谷歌、微軟、英偉達、華為、百度、阿里等科技巨頭以及多個科研機構參與其中,各家大模型的引數量級也從千億、萬億,迅速提升至10萬億級別。

不過,在AI大模型熱度持續攀升的過程中,各家的佈局重點有所不同。近日,鵬城實驗室與百度聯合召開發佈會,正式釋出雙方共同研發的鵬城-百度·文心(模型版本號:ERNIE 3.0 Titan)。據介紹,該模型引數規模達到2600億,是目前全球最大中文單體模型,也是全球首個知識增強千億大模型。

“如果將這個模型的特點總結為一條,就是知識增強。”在接受包括21世紀經濟報道在內的媒體採訪時,百度集團副總裁吳甜分析稱,“同時,在融入知識的基礎上,該模型也會進行跨語言學習、跨模態學習,從而體現出學習效率更高、學習能力更強的優勢。”

知識增強大模型

鵬城-百度·文心知識增強大模型的最大特點,在於其在學習過程中融入知識,進而實現將海量知識與海量資料進行同時融合的學習。

在吳甜看來,知識帶來的優勢在於學習效率更高。據介紹,鵬城-百度·文心知識增強大模型在包括機器閱讀理解、文字分類、語義相似度計算等60多項任務上取得最好效果,並在30餘項小樣本和零樣本任務上重新整理基準。

“這說明模型本身的效果足夠好。”吳甜分析稱,“我們看到那60多個任務是各種各樣的不同任務,體現出模型具備較好的通用性。同時在30多項小樣本、零樣本學習上,模型也取得了更好效果,意味著它的泛化能力更強,在看到不同場景和任務的時候可以透過少量資料標記就能實現良好效果。”

需要注意的是,早在今年1月,谷歌便釋出了全球首個萬億級模型Switch Transformer,引數規模達到1.6萬億。11月,阿里巴巴達摩院公佈的多模態大模型M6的引數規模更是躍升至10萬億級別,成為全球最大的AI預訓練模型。

相較之下,鵬城-百度·文心知識增強大模型的引數規模僅2600億,如何看待這樣的規模量級?

吳甜解釋稱,當前AI預訓練大模型分為“單體模型”和“混合專家模型”兩類。所謂單體模型也是稠密模型,具備稠密引數,將所有資料中習得的規律都記錄在一張網路內,使用時網路上的任何點位都會被計算到,鵬城-百度·文心知識增強大模型正屬於此類。

“混合專家模型”則是稀疏模型,是由多個不同網路透過門控機制整合在一起,在單次計算中可能只會使用部分子網路的引數。目前,兩類大模型也代表了不同的AI預訓練的技術方向。

“目前來說,我們能看到最大發布的單體模型是千億量級的,市面上的萬億、十萬億等都是混合專家模型。”吳甜表示,“到現在還沒有公開研究表明,萬億乃至十萬億的混合專家模型效果能夠媲美千億的單體模型,這個問題本身還值得進一步繼續研究。”

降低AI應用門檻

大模型近年來受到追捧,並非沒有原因。

本輪的第三次人工智慧浪潮中,伴隨著高效能計算機、因特網、大資料、感測器的普及,以及計算成本的下降,“機器學習”隨之興起。所謂機器學習(Machine leaning),是指讓計算機大量學習資料,使它可以像人類一樣辨識聲音及影像,或是針對問題做出合適的判斷。

其中,最受關注的莫過於深度學習,亦即透過模仿人腦的“類神經網路”(Neural network)來學習大量資料的手法。深度學習的演進與發展則源自大資料、大算力、大模型三大支撐。

在吳甜看來,從某種程度而言,這三大支撐要素也構成了深度學習及人工智慧技術的瓶頸所在,包括大量的資料標註背後高昂的成本、資料標註本身的天花板等都是難題所在。與之相對應的,預訓練技術則解決了讓演算法在海量無標記資料中進行自監督學習,從而帶來技術上的突破與變化。

“隨著預訓練技術的突破,幾乎可以認為所有任務現在都是基於預訓練機制實現全面的效果提升。”吳甜解釋稱,“而透過大算力平臺支撐,實現時間、模型體積、引數規模的增長,進而便形成當前一系列大模型的誕生。”

從這個角度而言,預訓練大模型具備相當的價值。“大模型對於產業而言,其意義在於降低了AI應用門檻。”吳甜表示。

在吳甜看來,目前行業內的AI技術應用存在兩大困難。首先在於資料標註非常昂貴,甚至在特定場景內無法完成大批次批註,另一方面在行業應用中,行業自身的知識積累至關重要。預訓練大模型的推出,則能夠在不具備大量資料標註的同時保證了技術基礎底座,疊加行業“基本功”便能夠實現AI技術的快速落地。

據介紹,目前百度文心透過百度飛槳平臺陸續對外開源開放,並已大規模應用於百度搜索、資訊流、智慧音箱等網際網路產品,同時透過百度智慧雲賦能工業、能源、金融、通訊、媒體、教育等各行各業。

更多內容請下載21財經APP

分類: 數碼
時間: 2021-12-14

相關文章

最快下個月索尼A7M4釋出!佳能、尼康什麼相機值得買?

最快下個月索尼A7M4釋出!佳能、尼康什麼相機值得買?
很多人都在問,什麼時候RF卡口和Z卡口出副廠鏡頭呀?價格漲成這樣,口水直流,但是買不起呀!其實騰龍.適馬何嘗不是口水直流,眼前一塊肉,就是不敢張口(EF卡口和F卡口鏡頭銷量下滑太厲害了).根據最新訊息 ...

兩款7000元左右的微單套機:佳能M6二代和索尼A6400 誰更值得買?

兩款7000元左右的微單套機:佳能M6二代和索尼A6400 誰更值得買?
大家都知道,現在你看數碼相機的銷售網頁以及測評,基本上都只說好處,不提缺陷,而我這裡不同,優點和缺陷全都說.廢話不多說,直接進入主題:兩款7000元左右的微單套機:佳能M6二代和索尼A6400 誰更值 ...

原價出掉使用兩年的黑卡5!在A7M4臨近發售之際入手索尼A7C

原價出掉使用兩年的黑卡5!在A7M4臨近發售之際入手索尼A7C
創作立場宣告:分享自己的新相機入手過程和喜悅,開箱曬單非測評,歡迎交流. 大家好,我是GT_7,關注我瞭解各類生活好物. 在站內看很多大佬的照片拍得非常漂亮,於是問了好幾個大佬用的什麼相機,多數都是用 ...

索尼α7 IV新機4K60p 是 S35 4.8K 超取樣,具備10bit422,誠意滿滿

索尼α7 IV新機4K60p 是 S35 4.8K 超取樣,具備10bit422,誠意滿滿
Sony AlphaRumors 網站今天又透露了 索尼 α7 IV 影片功能的新訊息:索尼 A7IV 將是從 4.8k s35 格式中超取樣4k 60p,並具備 10bit 4:2:2 色彩模式. ...

索尼α7 IV將在10月21日正式釋出,4k60p有了,是跳採?還是裁切?

索尼α7 IV將在10月21日正式釋出,4k60p有了,是跳採?還是裁切?
SonyAlphaRumors 網站正式確定了 索尼 α7 IV 釋出日期為10月21日. 索尼α7 IV最近一段時間裡訊息不斷,各種猜想滿天飛.但是現在已經確定 a7 IV 最終會在 10 月 21 ...

索尼70-200/2.8Ⅱ鏡頭正式釋出,新鏡頭在那些方面有了較大的提升

索尼70-200/2.8Ⅱ鏡頭正式釋出,新鏡頭在那些方面有了較大的提升
前天剛剛寫了一篇文章對比索尼二代的大三元70-200mm F/2.8與一代大三元鏡頭的部分效能對比,但是由於當時索尼還沒有正式釋出,所以新鏡頭的資訊不那麼充分,不能進行全面地對比,今天,索尼已經正式釋 ...

為了拍娃,我賣掉索尼全幅入手奧林巴斯M43

為了拍娃,我賣掉索尼全幅入手奧林巴斯M43
在發文前,我思考了很久,這篇文章該怎麼寫,龐大的全畫幅陣營會不會噴我?賣掉索尼全幅轉而入手了奧巴的m43,並不是我認為索尼全幅不如奧巴m43,索尼全幅有非常多的優點,新款機型有了太多讓人心動的升級.然 ...

中國晶片產業的突破!新一代國產先進光刻機來了,有兩個重大意義

中國晶片產業的突破!新一代國產先進光刻機來了,有兩個重大意義
眾所周知,我國在光刻機領域一直處於弱勢地位,國內晶片行業的先進光刻機一直依靠進口.<科技日報>在2018年曾經評選出35項制約我國工業發展的"卡脖子"技術,晶片和光刻機 ...

餐廳掛畫選多大尺寸才合適?看看這些你就知道

餐廳掛畫選多大尺寸才合適?看看這些你就知道
細節決定一個人的品味,很多時候人們最容易忽略的就是細節,正是因為這一點點細節,會影響整個大環境的格調. 畫家李志永國畫九魚圖<連年有餘>作品來源:聚藝上品 餐廳是人們吃飯的重要場合,營造一 ...

友都八喜9月上半月相機銷量排名 EOS R6重回榜首尼康雙機上榜

友都八喜9月上半月相機銷量排名 EOS R6重回榜首尼康雙機上榜
CAPA CAMERA WEB公佈了日本電器銷售平臺友都八喜(Yodobashi)9月上半月相機銷量排行榜,佳能EOS R6重回榜首,奪回了7月下半月以來的頭把交椅:索尼α7C衛冕之路受阻. 友都八喜 ...

索尼A7M4真的來了,嗎?大膽預測售價兩個達不溜內

索尼A7M4真的來了,嗎?大膽預測售價兩個達不溜內
去年開始,關於索尼A7M4的訊息一直傳得滿天飛,什麼樣的訊息都有,但是一直到現在的都還遲遲未出.目前最新訊息稱,如果晶片供應正常的話,索尼將在十月舉辦釋出會,正式推出這一款索尼A7M4微單相機.相信大 ...

尼康的翻身仗?無反版本的D6?尼康Z9官方釋出影片

尼康的翻身仗?無反版本的D6?尼康Z9官方釋出影片
隨著無反相機的競爭越來越激烈,除了入門級和中端產品亮相量產,無反旗艦產品也加入了軍備競賽之中,隨著佳能索尼的旗艦產品釋出,老對手尼康的旗艦產品也可謂是箭在弦上了.最新的尼康無反旗艦相機Z9訊息越來越多 ...

情報站 | 佳能EOS R3供不應求 徠卡新機細節曝光

情報站 | 佳能EOS R3供不應求 徠卡新機細節曝光
- 熱門器材資訊傳聞速報 - 佳能EOS R3和多款RF鏡頭供不應求 佳能宣佈"EOS R3"和許多RF鏡頭.配件供應短缺. 我們收到以下多款產品的訂單超出預期,交貨前需要一些時間 ...

一臺高顏值的塑膠玩具?尼康Zfc詳細使用測評

一臺高顏值的塑膠玩具?尼康Zfc詳細使用測評
一臺高顏值的塑膠玩具?尼康Zfc詳細使用測評 如果大家之前關注過我的文章,應該都知道我是個資深富士使用者.目前手頭的X-T4也用了一年多了,伴隨著我隨心飛,也拍了三四萬張照片了.可能是因為我的確是個喜 ...

情報站 | 索尼A7IV可以拍攝4K/60P 70200GM二代後天釋出

情報站 | 索尼A7IV可以拍攝4K/60P 70200GM二代後天釋出
- 熱門器材資訊傳聞速報 - 索尼A7IV的4K/60P為s35模式 據最新訊息,索尼A7IV 可以錄製 4K/60P影片,s35mm剪裁模式 . 索尼 A7IV 傳聞規格: 10月21日釋出(如果晶 ...

索尼對於VISION-S沒有具體計劃,更多細節明年CES見

索尼對於VISION-S沒有具體計劃,更多細節明年CES見
2020年的CES上,索尼帶來了VISION-S概念車,讓人們看到了索尼對於造車的「小目標」.但自此之後VISION-S就鮮有露臉的機會,除了今年5月份被拍到路試諜照. 近日,索尼執行副總裁川西泉對媒 ...

國產新能源“實力派”,入門續航510km,配索尼音響,實拍大螞蟻

國產新能源“實力派”,入門續航510km,配索尼音響,實拍大螞蟻
越來越多的傳統車企開始向新能源靠攏,品牌的轉型不僅會讓品牌得到發展,也會讓消費者有更多的選擇性.在合資品牌中,大眾.奧迪.寶馬.賓士等一系列品牌都帶來純電動車型,就在前不久,奧迪宣佈停止對內燃機的研究 ...

索尼推出PS5專用固態硬碟,2TB容量售價高達4000元

索尼推出PS5專用固態硬碟,2TB容量售價高達4000元
近日索尼更新了PS5的硬體驅動,開始支援玩家自己外接固態硬碟.這不官方也開始發力了,立馬推出了兩款固態硬碟,2TB版本售價高達4000元. 要知道這個價格都相當於,一款PS5主機的售價.不過價格高效能 ...

LG 和索尼推出首批 83 寸 OLED 電視

LG 和索尼推出首批 83 寸 OLED 電視
4K OLED 的尺寸越做越大,LG 和索尼的首批 83 寸 OLED 電視現已在歐洲.北美和其他地區推出. LG 將推出其首款 83 寸 4K OLED 電視,作為 C1 型號的拓展,而索尼則將推出 ...

索尼5500mAh新機即將釋出,4K屏+6400萬蔡司影像,夠專業

索尼5500mAh新機即將釋出,4K屏+6400萬蔡司影像,夠專業
索尼作為音像行業的大佬,也開始做起了手機,不過國內知道的人可能寥寥無幾,銷量也是很慘淡.不過銷量不好除了沒有在中國市場大力宣傳之外,Xperia 1 III 的價格也是很高的,即便是釋出了好幾個月,X ...