作為 Google 母公司 Alphabet 旗下的人工智慧企業,DeepMind 剛剛宣佈了其最新打造的 AlphaCode 程式設計 AI 。據悉,該公司透過人類比賽中使用的程式設計挑戰題目,對 AlphaCode 展開了一番實際測試。雖然暫時還達不到業內頂尖水平,但現階段已經能夠和普通程式設計師打個平手。
儘管該 AI 技能不一定代表 AlphaCode 可輕鬆應對人類程式設計師的日常工作任務,但 DeepMind 還是宣稱達到了預期的排名,使之能夠躋身於人類程式設計師的前 54% 之列。
DeepMind 首席研究科學家 Oriol Vinyals 在致 TheVerge的一封電子郵件中稱,這項研究仍處於早期階段,但現階段的成果已讓該公司更接近於打造一套可靈活解決問題的人工智慧。
目前只有人類程式設計師能夠自主解決相關程式設計挑戰,但從長遠來看,AlphaCode 仍可在協助程式設計師 / 普通人編寫程式碼、提升生產力、或創新軟體製作方法等方面,具有振奮人心的巨大潛力。
測試期間,DeepMind 讓 AlphaCode 針對 Codeforces 策劃的程式設計挑戰開展了測試。後者是一個極具挑戰性的程式設計平臺,透過類似於國際象棋的 Elo 評級系統來分享每週問題和相關排名。
這些挑戰不同於程式設計師在製作商業應用程式時可能接受的任務,需要對計算機科學領域的演算法和理論概念有更廣泛的瞭解,才能更好地結合邏輯、數學、程式設計專業知識來解決相關謎題。
為評估 DeepMind 的 AlphaCode AI,其選擇了一個名叫 Backspace的示例挑戰專案。該問題難度適中,在左側顯示了相關描述、並於右側展示了測試用例。
其要求參賽者找到一種方法,使用一組有限的輸入,將一組隨機、重複的 s 和 t 字母字串,轉換為另一個相同字母的字串。
這意味著在解題過程中,程式不能只輸入新字母,而是必須使用退格鍵來刪除原始字串中的幾個字母。
其中十次挑戰以人類完全相同的格式來輸入給 AlphaCode,然後該 AI 就可生成大量可行的答案,並透過執行程式碼和檢查輸出來篩選這些答案。
更棒的是,Yujia Li 和 David Choi 在郵件中提到,整個過程都是自動進行的,而無需人工介入去挑選最佳的樣本。
最終 AlphaCode 針對 Codeforces 網站上 5000 名使用者解決的十個挑戰專案開展了測試,且拿下了平均位於前 54.3% 行列的成績。
DeepMind 預估該系統的 Codeforces Elo 為 1238,使之立於過去 6 個月在該網站上發起挑戰的使用者榜單的前 28% 。