[新聞] Facebook偷偷參加了一場AI星海爭霸賽 結果

作者: zkow (逍遙山水憶秋年)   2017-10-14 08:38:29
Facebook偷偷參加了一場AI星海爭霸賽 結果輸了
  來源:36氪
  在銀河系遙遠的克普魯星區,Facebook的一群跳蟲(Zerglings)正在焦躁不安的在
敵軍基地外面徘徊。在腦袋缺根筋的指揮官打開大門後,該社交網路的外星人蜂擁而入,
在一場爭奪人工智慧研究前沿陣地的戰鬥中對駐紮在裡面的部隊大開殺戒。
  這場血腥事件是一年一度的由AI軟體機器人參賽的星海爭霸比賽的一部分,今年的比
賽剛剛在本周日結束。Facebook悄悄的派了一個名為CherryPi的機器人參賽,這是有其AI
研究實驗室的8個人設計出來的。
  這場秘密的太空站說明Facebook對與Google等就率先達到AI的下一個閃耀的里程碑的
競爭是認真的。Google的DeepMind AI研究部門去年因為Alphago擊敗了圍棋世界冠軍而登
上了新聞頭條。今年8月,DeepMind宣佈將最新版的星海爭霸II作為自己的下一個目標。
  就像本領域大多數的AI研究一樣,Facebook參加的這場比賽使用的是更舊版的星海爭
霸,這個版本在難度上被認為對軟體和玩家都是一視同仁的。Facebook的AI研究部門由紐
約大學教授Yann LeCun牽頭,旗下有80多位研究人員,目前已經發表了很多的研究論文,
但是還沒有取得任何像Google在圍棋方面一樣令人震驚的成就。關於星海爭霸Facebook已
經發表了3篇研究論文,但還沒有宣佈要征服此遊戲的任何特別行動。
  周日公佈的最終結果表明Facebook仍然有一段路要走:在總共28位參賽選手中
CherryPi的排名為第6;而前3位都是由獨立的程式設計愛好者寫出來的。
  Facebook的研究科學家Gabriel Synnaeve把CherryPi說成是將來對星海爭霸研究的“
基線”。他說:“我們希望看到它跟其他現有機器人的對比情況,尤其是想測試一下是不
是還有需要修正的瑕疵。” CherryPi參加了一場馬拉松式的競賽,這是研究AI在娛樂業
應用的學術會議AIIDE的一部分。Facebook還贊助了今年的競賽,成千上萬的機器人對戰
遊戲所用的硬體都是由Facebook出錢的。
  自從1950年代以來,像一字棋、跳棋、國際象棋以及圍棋這樣的遊戲一直都是人工智
慧新思路的試驗台。這段日子以來,隨著公司日益用AI來作為打磨自身產品和服務的手段
,AI還要服務於嚴肅的商業目的。Facebook、Google等技術公司用AI來改進定向廣告和個
性化系統,並且給虛擬助手和增強現實等新產品提供支援。
  星海爭霸對AI研究人員的誘惑力可不僅僅在於操弄武器發號施令的樂趣。儘管該遊戲
看似比圍棋或者國際象棋更平易近人,但是複雜度卻要比後者高得多,因為玩家的裝備和
行動都不是局限在固定的棋盤上並且處在對方的完整視圖下面的。圍棋棋盤的有效位置數
是1後面跟170個0。研究人員估計,要想遍歷星海爭霸的複雜度,你還需要在那個數後再
加100個0。
  今年獲勝的機器人叫ZZZKBot,開發者是澳大利亞珀斯的軟體發展者Chris Coxe,他
之前曾在納斯達克工作過。這個機器人是他自己一個人開發的,後來為了留出更多的時間
做做這個他甚至停了一段時間工作。在最終結果出爐前1一天,Coxe曾經這樣調侃自己的
作品。他說:“這東西只是用來概念驗證。源碼一點都不好。”
  就像迄今為止所有的星海爭霸機器人一樣,在遊戲技能一般的人類玩家面前ZZZKBot
也頂不了太久。對異族人部隊的調動做出預測和反應需要的計畫和記憶遠遠超出了目前軟
體的能力範疇。
  隨著在網上廣告和AI方面同時展開競爭的兩大巨頭表現出興趣,愛好者做出最好的星
海爭霸機器人的日子似乎已經屈指可數。這次AIIDE競賽的組織者,紐芬蘭紀念大學教授
David Churchill預計,未來幾年星海爭霸機器人的局面將會發生天翻地覆的變化。
  Facebook和Google稱自己開發星海爭霸機器人的辦法跟大多數個人程式師都不一樣。
領先的機器人大多數是基於創建者制訂的規則和策略進行遊戲的。Coxes說他的機器人最
好的功能之一是簡單學習功能,機器人會嘗試預先程式設計的針對其他對戰機器人的策略
,然後記錄下來哪一種策略有效,從而為下一場比賽做準備。兩大技術巨頭打算更倚重於
機器學習,計畫讓機器人依靠檢查過去比賽資料的龐大緩存或者重複實驗從頭開始制訂自
己的策略。Facebook並沒有按照自己發佈的想法開發CherryPi。而機器學習則是Google的
Alphago不可戰勝的核心。
  雖然Facebook的機器人沒能贏得星海爭霸戰,但排名第二的機器人PurpleWave的開發
者Dan Gant卻看到了CherryPi將來的走勢。大多數機器人的選擇是根據敵方的相對人數要
麼正面進攻,要麼撤退。但Gant說,從競賽結果公佈前發佈的視頻看,CherryPi似乎知道
什麼時候自己可以足夠快地偷襲地方基地。
  儘管如此,不要指望獨立機器人開發者一夜之間就會消失得無影無蹤——或者指望星
海爭霸很快就會被征服。Churchill說:“問題仍然非常困難。我預計幾年之內愛好者做
的主要基於規則的機器人仍然會表現出色。”他猜測任何機器人想要擊敗專家級玩家仍需
要5年的時間——但承認也許會更快。
  紐約的軟體發展者Gant今年停下了手頭的工作,用了幾個月的時間專門來做
PurpleWave。他說技術巨頭的加入增加了一項代表著獨特學習機會的追求的影響力。他說
:“無論你是Facebook還是DeepMind或者是剛剛在學習程式設計的小孩,大家都在同一個
競技場公平競技。能限制你的只有自己的努力和能教到自己的東西。”
  做出一個星海爭霸的超級玩家能給技術巨頭帶來的不只是滿足感。Google說DeepMind
的機器學習已經幫助它削減了自己資料中心的製冷成本。微軟今年的一篇有關機器學習的
研究論文說,預測用戶何時會點擊的準確率哪怕只提升0.1個百分點也能帶來數億美元的
新收入。有能力領導蟲族隊伍衝鋒陷陣擊潰任何人類的機器人也許很快就能賺大錢。
http://sports.sina.com.cn/go/2017-10-13/doc-ifymviyp0843275.shtml

Links booklink

Contact Us: admin [ a t ] ucptt.com