sponsored links

華人夫婦斬獲IEEE最佳論文和ACM Demo冠軍!團隊連發4篇Nature子刊

編輯:好睏 LRS

【新智元導讀】由聖母大學史弋宇教授和匹茲堡大學胡京通教授領銜的90後華人伉儷,姜煒文博士與楊蕾博士兩年前的研究如今修成正果,斬獲IEEE TCAD的最佳和DAC的University Demo雙項冠軍,可以說是理論和實踐兩開花!並且這篇論文也是開創了NAS的一個新領域,拉開了神經網路與硬體協同搜尋的新時代。

開發AI模型就像一個堆積木的過程,透過組合各種可以用到的網路層來找到一個性能更強的網路。

後來研究人員發現這個搜尋過程其實也可以自動化完成。

神經架構搜尋(Neural Architecture Search,NAS)的出現極大推進了AI向各行業進軍的速度,甚至在某些任務上已經能夠媲美人類專家了,並且還能發現一些人類之前未曾提出過的網路結構,可以說是極大提升了神經網路的使用和設計效率。

但神經網路的訓練、推理和部署從來都不只是軟體工程師的事,哪有什麼歲月靜好,只是各位硬體設計師一直在默默負重前行。

華人夫婦斬獲IEEE最佳論文和ACM Demo冠軍!團隊連發4篇Nature子刊

訓練好的神經網路模型有可能部署在各種各樣的硬體架構上,而硬體的架構反過來也會影響著模型的效能、吞吐量等等。

兩年前,就算考慮了硬體的NAS研究,也都只是在固定硬體架構的情況下琢磨如何提高效能,直到這篇論文的出現。

華人夫婦斬獲IEEE最佳論文和ACM Demo冠軍!團隊連發4篇Nature子刊

https://arxiv.org/pdf/1907.04650.pdf

這篇論文提出了一個全新的NAS框架,同時考慮了神經架構搜尋空間(neural architecture search space)和硬體設計空間(hard design space)來找到和硬體匹配的最佳網路架構,這種方式能夠最大限度地提高模型的效能和執行效率。

在ImageNet上的實驗也證明了採用協同搜尋的NAS可以在精度不變的情況下,吞吐量提高35.24%,能量效率提高54.05%。

華人夫婦斬獲IEEE最佳論文和ACM Demo冠軍!團隊連發4篇Nature子刊

論文的成果經過兩年時間的檢驗後,最近獲得兩項大獎。一項是代表理論的TCAD最佳論文獎,另一項是代表應用研究的University Demo冠軍,擊敗了來自MIT, University of Virginia等10所高校。可以說是文體兩開花了。

華人夫婦斬獲IEEE最佳論文和ACM Demo冠軍!團隊連發4篇Nature子刊

論文由重慶大學博士伉儷姜煒文和楊蕾在聖母大學史弋宇教授和匹茲堡大學胡京通教授指導下完成。

華人夫婦斬獲IEEE最佳論文和ACM Demo冠軍!團隊連發4篇Nature子刊

第一作者姜煒文博士是喬治梅森大學助理教授,除了NAS領域,他還建立了第一個神經網路/量子計算協同設計框架QuantumFlow,證明了在量子計算機上設計神經網路的量子優勢,2021年也是一口氣在Nature子刊上發了三篇論文。

對於此次拿獎,姜煒文博士表示:「該獲獎工作是我們一些列軟硬協同神經網路加速工作的基礎,這些工作先後在DAC,CODES+ISSS,ASP-DAC會議上獲得多次提名最佳論文,這次終於修成正果。」

楊蕾博士是新墨西哥大學助理教授,目前主要從事系統級自動化機器學習應用的工作。

史弋宇博士於2021年在聖母大學晉升為終身正教授,其帶領團隊在過去1年發表了4篇Nature子刊。

胡京通博士於2020年在匹茲堡大學晉升終身副教授,並於2021年獲得William Kepler Whiteford Faculty Fellow。

史弋宇教授表示:「我們軟硬協同神經網路加速的工作除了TCAD的best paper以外,具體在實際產品上的應用還在DAC的University Demo拿了first place。希望這方面接下來還能有所突破。」

經典回顧

儘管NAS在各種任務,包括影象分類、影象分割和語言建模的模型架構設計中取得了巨大成功,但除了準確性之外,我們也應該考慮推理的時間效能(如延遲或吞吐量)。

華人夫婦斬獲IEEE最佳論文和ACM Demo冠軍!團隊連發4篇Nature子刊

隨著AI的發展,大量雲計算平臺和邊緣計算裝置都能夠採用能自由設計硬體的FPGA,相比傳統的專用專用積體電路ASIC,FPGA能夠極大提升電路的硬體設計空間,從而找到一個能讓神經網路發揮最佳效能的硬體電路。

所以如果有一個模型能夠同時設計神經網路架構和FPGA硬體架構,那效能豈不是更強?

華人夫婦斬獲IEEE最佳論文和ACM Demo冠軍!團隊連發4篇Nature子刊

文中提出的HW/SW 協同搜尋的框架包含一個基於RNN的控制器和兩個層次的搜尋,其中子網路中的每個RNN的單元在面對不同的最佳化目標時都會被重組(reorganized)。

華人夫婦斬獲IEEE最佳論文和ACM Demo冠軍!團隊連發4篇Nature子刊

在第一層的快速搜尋中主要包含四步:

1、以機率p預測一個模型架構

2、在滿足吞吐量限制條件的情況下,搜尋設計空間來生成一個pipelined FPGA系統

3、根據流水線的結構,重組控制器中的RNN單元

4、使用強化學習最大化pipeline的效率來更新控制器引數

華人夫婦斬獲IEEE最佳論文和ACM Demo冠軍!團隊連發4篇Nature子刊

在重組和更新控制器時,由於我們的生成目標是找到更高硬體利用率的子網路,所以採用的策略是最大化平均硬體利用率。

最大化平均硬體利用率和最大化每個硬體的利用率之間就是全域性和區域性的區別,如果要找到全域性最優解,那所搜尋的設計空間要比區域性空間更大,基本是指數級的。

所以為了有效地搜尋設計空間,研究人員選擇了局部策略,最大化不同流水線階段的硬體利用率,並且根據確定的pipeline結構重組控制器中的RNN單元。

對於一個pipeline的多個層,RNN單元的權重和狀態都是共享的,所以N個pipeline只需要N個RNN單元就可以最大限度地提高每個FPGA pipeline階段的硬體利用率。

在第二層時,研究人員對對第一層得到的子網路進行訓練,訓練資料中保留一部分作為驗證集。在訓練完畢後將根據生成模型的準確率和pipeline效率作為評價標準生成一個獎勵來更新RNN控制器。如果第一層生成的子網路都不符合吞吐量的要求,將會產生一個負獎勵。

在第二層預測後,控制器將會在架構搜尋空間中預測一個新的子網路,用於下一次的快速搜尋。

華人夫婦斬獲IEEE最佳論文和ACM Demo冠軍!團隊連發4篇Nature子刊

在第一層更新控制器中的RNN單元之前,需要對所有RNN單元權重進行快照儲存。根據確定的pipeline結構,RNN單元再被重組,以便為之前獲得的硬體設計(即pipeline結構)生成更好的子網路。

在進入慢速搜尋層後,控制器中的RNN單元將使用先前儲存的權重快照進行恢復。然後以準確度為目標來訓練子網路,然後利用獎勵函式更新恢復RNN。透過這種迭代方式,準確率將會不斷提升,並且找到一個最佳的硬體設計。

和以往的研究不同的是,文中提出的RNN控制器集成了多個RNN單元,能夠同時對兩個層進行最佳化,在效率和準確率之間更好地權衡和最佳化。

總的來說,在第一層中,RNN只對給定的模型架構進行最佳化;而在第二層的時候RNN將會確定模型的骨架網路和pipeline結構。

結果分析

由於硬體容量的限制,所有架構的引數都少於100萬個,這不可避免地導致了準確性的損失。

但是依然可以看到,OptSW搜尋的架構在CIFAR-10上仍可以達到85.19%的測試準確率,並在ImageNet上達到70.24%的top-1準確率。這些結果證明了協同搜尋方法在資源有限的情況下的有效性。

此外,OptSW優於硬體感知NAS,在CIFAR-10和ImageNet上分別取得了54.37%和35.24%的吞吐量,以及56.02%和54.05%的能效。

與順序最佳化相比,OptSW在CIFAR-10上的吞吐量和能效分別提高了16.34%和28.79%;在ImageNet上,它也能略微提高吞吐量,並實現37.84%的能效提高。

華人夫婦斬獲IEEE最佳論文和ACM Demo冠軍!團隊連發4篇Nature子刊

在CIFAR-10和ImageNet上的準確性、pipeline效率、吞吐量和能效的對比

透過在快速搜尋層面進行有效的早期階段修剪,協同搜尋可以極大地加快搜索的過程,並在CIFAR-10和ImageNet上分別實現了159倍和136倍的速度。

與傳統的控制器中只有一個RNN的硬體感知NAS相比,具有多個RNN的協同搜尋框架可以將設計空間從O(∏i Di)大幅縮小到O(∑i Di),其中Di是第i個管道階段的設計空間大小。

從表中「訓練架構」中可以看到,協同搜尋與硬體感知NAS相比,訓練的架構要少得多。由於需要訓練的架構數量與設計空間的大小成正比,因此協同搜尋也實現了顯著的速度提升。

華人夫婦斬獲IEEE最佳論文和ACM Demo冠軍!團隊連發4篇Nature子刊

硬體感知NAS和協同搜尋的歸一化搜尋時間的對比

參考資料:

https://ieee-ceda.org/awards/ieee-transactions-computer-aided-design-donald-o-pederson-best-paper-award

https://www.sigda.org/sigda-events/ubooth/

分類: 汽車
時間: 2021-12-19

相關文章

2022款大切諾基最新價格曝光 價格小幅上漲/37390美元起售

2022款大切諾基最新價格曝光 價格小幅上漲/37390美元起售
[佰咖汽車·進口新車資訊]近日,我們從外媒處獲悉2022款吉普大切諾基的最新價格已經曝光,入門級車型的起售價為37390美元.據悉,新車有望於2021年底上市銷售. 吉普於2021年1月首先推出了新的 ...

2022款長安CS75PLUS上市,運動氛圍出色,“明日設計”更進一步

2022款長安CS75PLUS上市,運動氛圍出色,“明日設計”更進一步
導語:隨著國內緊湊級SUV市場近幾年的快速發展,從品牌到產品都開始加速產品的佈局與完善,而對於各家的"拳頭產品"就更要注重市場反饋,及時更新產品配置或是老車主反應的小問題,才能保持 ...

8.58萬元帶來的超值體驗 試駕2022款風光500

8.58萬元帶來的超值體驗 試駕2022款風光500
在幾年前,別說8萬元左右了,就算是10萬元這個價位區間都是自主品牌小型SUV的領域.如今誰曾想,10萬元以內就已經出現了緊湊型SUV,並且售價還僅僅只有6.18萬-8.58萬元,它就是我們今天的主角2 ...

內飾升級明顯 雪佛蘭推出2022款索羅德皮卡

內飾升級明顯 雪佛蘭推出2022款索羅德皮卡
近日,雪佛蘭釋出了2022款索羅德皮卡,作為中期改款車型,新車在多方面進行了更新與升級.2022款索羅德此次改款的目的非常明確,那就是希望超越身前的Ram 1500,成為位於福特F系列皮卡之後的美國市 ...

小米電視ES 2022款和小米電視EA 2022款買哪個好?參考配置詳細對比

小米電視ES 2022款和小米電視EA 2022款買哪個好?參考配置詳細對比
作為國產彩電的代表,小米在2013年首次進入智慧電視領域,推出首款號稱年輕人的第一臺電視--小米電視,最近兩年在智慧電視行業也是風生水起,2019年與2020年連續兩年成為國內電視出貨量第一名.而在2 ...

繼續維持標杆地位 詳解上汽大眾新途觀L/2022款途觀X

繼續維持標杆地位 詳解上汽大眾新途觀L/2022款途觀X
8月3日,上汽大眾宣佈新 途觀L ( 引數 | 詢價 ) 與2022款途觀X預售開啟.作為整個中型SUV市場無可爭議的標杆級產品,上汽大眾途觀家族目前在國內市場的累計銷量已經超過了240萬輛,但隨著消 ...

新增48伏輕混,低扭表現更佳,試駕2022款昂科旗艾維亞

新增48伏輕混,低扭表現更佳,試駕2022款昂科旗艾維亞
三孩政策的放開,進一步激發了中型.中大型SUV的市場活力.僅在今年上半年,就有多款新品上市,有我們耳熟能詳的途昂和漢蘭達,也有新加入的一汽-大眾攬境,扎堆上市的場景在這個級別市場中實在不多見,競爭的激 ...

2022款克萊斯勒Pacifica全面升級 起售價48320美元/可選裝AWD選項

2022款克萊斯勒Pacifica全面升級 起售價48320美元/可選裝AWD選項
[佰咖汽車·進口新車資訊]近日,我們從外媒獲取到一組全新的2022款克萊斯勒Pacifica的最新實拍圖.新車標配前輪驅動系統,可選裝AWD系統.據悉,新車的起售價為48,320美元,如果選裝AWD系 ...

配置小幅改動,2022款大眾途鎧上市
近日,2022款大眾途鎧正式上市,作為年度改款車型,共推出2種動力共計5款車型,售價區間為11.49-15.99萬元. 外觀方面,延續了大眾家族的設計語言,進氣格柵採用山嶽起伏式設計,側面採用了雙腰線 ...

2022款小途嶽上市!部分車型增配氣囊、液晶儀表等,定價同老款

2022款小途嶽上市!部分車型增配氣囊、液晶儀表等,定價同老款
上汽大眾2022款途鎧上市之後,再次引起了車迷之間的熱議,而爭議的焦點仍然是集中在價格方面,很多車迷表示,作為一款小型SUV定價比緊湊型SUV的捷達VS5都高,為什麼還要買途鎧呢?其實,儘管兩款車系有 ...

2022款豐田Sienna特別版46565美元起

2022款豐田Sienna特別版46565美元起
日前,豐田官方正式公佈了2022款豐田Sienna Woodland特別版的售價,新車的起售價為46565美元(約合人民幣29.95萬元),中配版本的售價為48000美元(約合人民幣30.87萬元), ...

用什麼捍衛旗艦形象?試駕:2022款哈弗H9

用什麼捍衛旗艦形象?試駕:2022款哈弗H9
作為國產硬派越野的代表車型,哈弗H9一直都被越野迷所追崇,無論是其粗狂且霸氣的外觀還是出色的越野效能,都在獲得了不少越野玩家的認可. 在注重顏值與產品實力的新時代,坦克300的爆火將硬派越野這一細分領 ...

動力提升明顯/售價依舊親民 試駕2022款風光500

動力提升明顯/售價依舊親民 試駕2022款風光500
風光品牌旗下產品一向以極高的價效比著稱,風光500則是代表車型之一,花七八萬塊錢就能買到顏值.配置.空間.動力還都OK的緊湊級SUV,這在幾年前可是不敢想的.就在前不久,2022款風光500上市,售價 ...

豪華細節,享受入微,2022款別克昂科旗新款車型哪款最值得購買?

豪華細節,享受入微,2022款別克昂科旗新款車型哪款最值得購買?
受到缺芯風波的影響,今年汽車行業的"金九銀十"季多多少少都有些慘淡.由於整體產能減小,新車優惠力度也普遍減小.在這樣的大環境下,很多購車消費者都希望可以在預算內儘可能買到更全能的車 ...

各有千秋,奧迪多款2022款進口車正式上市

各有千秋,奧迪多款2022款進口車正式上市
近日,汽車輿論得知,奧迪進口車家族2022年型正式上市,此次2022款年型車多達10款,分別是Q7.Q8和A8L奧迪A5.奧迪A7 Sportback 奧迪A6 allroad.奧迪A6 Avant. ...

外觀小改/動力升級 2022款風光500實拍解析

外觀小改/動力升級 2022款風光500實拍解析
深挖SUV市場紅利,吸引年輕消費者,是近幾年大多數中國品牌車企的主要產品策略,特別是入門級SUV,更是不僅要延續高性價比的特色,而且在產品層面更加精品化.個性化,以期達到與對手間的差異競爭.此前,風光 ...

2022款風光500小身材大實力 6.18-8.58萬超燃上市

2022款風光500小身材大實力 6.18-8.58萬超燃上市
大家好!今天選車網為您帶來風光500的最新訊息,請點選關注選車網,第一時間瞭解最新的汽車資訊. 近日,選車網從相關渠道獲悉,2022款風光500上市了,新款車型的售價6.18-8.58萬,作為一款緊湊 ...

外在更運動 車廂更科技 配置更豐富 長安CS55 PLUS 2022款實拍簡評

外在更運動 車廂更科技 配置更豐富 長安CS55 PLUS 2022款實拍簡評
10萬級入門緊湊SUV中,長安CS55自從"PLUS"之後銷量就一路走高,去年又引入了藍鯨1.5T動力,使得它月銷量過萬成為常態.雖然三大件已經被消費者認可,但長安認為消費者還需要 ...

城市代步更從容 試駕體驗2022款風光500 1.5T

城市代步更從容 試駕體驗2022款風光500 1.5T
在中國品牌SUV的"內卷"時代下,保證產品高性價比的同時,更要實現精品化與個性化,如此才能吸引更多年輕消費者.而除了在造型與配置上尋求突破之外,動力上的提升也能吸引更多年輕消費者的 ...

消除油膩?簡評2022款日產軒逸,暢意出行?

消除油膩?簡評2022款日產軒逸,暢意出行?
緊湊級家用車市場的競爭可謂十分殘酷,許多車型採用了"N代同堂"的銷售策略,以加深不同層級消費者對其印象.在這其中,日產軒逸一定(甚至在某種程度上,長期將會是)是個難以忽略的車型. ...