[外絮] 騰訊最新AI在SC2上擊敗作弊電腦

作者: andy920262 (andy920262)   2018-09-26 14:23:15
原始論文:
https://arxiv.org/pdf/1809.07193v1.pdf
我本身是SC2玩家也對AI稍有研究,最近剛好看到這篇上禮拜才發表的論文,台灣似乎還沒什麼新聞或討論。
這篇應該是目前第一篇“公開”研究聲稱可以“進行整場遊戲並擊敗玩家”的論文,先前SC2的研究都是只能進行小遊戲的程度。
簡單來講,騰訊發表了2個不同的AI稱為TStarBot1跟TStarBot2在深海礁岩這張地圖進行ZvZ遊戲,APM限制在400-800。
TStarBot1是跟電腦對局了700萬場自我學習的,TStartBot2則是沒有經過學習直接被人類給予規則的AI(Rule-base AI)。
這兩隻AI對上作弊電腦分別取得80%跟90%的勝率,並成功擊敗白金~鑽石段位的玩家(不過場次很少)。
不過論文中有提到,TStarBot1在玩了700萬場後學到勝率最高的招式是異化蟲快攻,因此對上真實玩家多打幾場就會被破解。
而TStarBot2使用的戰術就比較多元,但以AI研究的角度來看,Rule-base AI就只是根據人類賦予的知識進行遊戲,並沒有辦法自行學習更強的戰術,因此現在的AI研究多半是自我學習為重點。
技術細節的部分我就不提了,有興趣了解的可以推文我盡量解答￿。
重點就是現在SC2 AI的研究還只能打打電腦,先前天梯高端有AI出沒的傳言多半是假的,不然就是除了騰訊外有其他尚未公開的研究在測試,雖然個人認為機率不高就是了。
作者: homelife (SKY)   2018-09-26 14:45:00
之前在API發表之後,Deepmind玩SC2似乎都還沒有消息?
作者: ws870325 (不懂)   2018-09-26 14:45:00
700萬場只會12d???
作者: kira925 (1 2 3 4 疾風炭)   2018-09-26 14:48:00
700萬場的Z學會了一個12D...而且是ZvZ...
作者: eternalviva (老人)   2018-09-26 14:51:00
應該不是只學會12D 而是12D效率最佳 XD學T的時候 大概也是每一場2BB
作者: homelife (SKY)   2018-09-26 15:00:00
沒有讀檔案內文,但如果是照AlphaGO的模式,一開始應該是從AI連規則都不清楚就讓他自己摸索?
作者: fragmentwing (片翼碎夢)   2018-09-26 15:10:00
deepmind的不是還在人族建築起飛戰術?
作者: lather (煞氣ㄟ溺水)   2018-09-26 15:13:00
2bb 12D 野bg 應該都是最高的 博弈心態再加上操作
作者: kira925 (1 2 3 4 疾風炭)   2018-09-26 15:16:00
400~800APM也太高了 200~400才合理吧看了下內容 他直接做了165個Macro 換句話說他已經先綁好AI會做什麼子動作了...不能說偷雞拉 因為確實這些動作是可以先設定好的但是就不是從0開始
作者: penut85420 (PenutGGorz)   2018-09-26 15:22:00
我覺得一開始有些Marco應該還算合理,如果一出世就有個Rule Base而且沒綁腳本感覺有點太可怕。不過很看好他的前景,期許有天可以改善遊戲內建的AI,甚至有機會指導玩家哪些細節需要改善發現筆誤,不是說Rule Base而是只有純輸入Rule
作者: aegis43210 (宇宙)   2018-09-26 15:40:00
強化獎勵的部份最難
作者: zero790425 (ULTIMATE)   2018-09-26 16:00:00
AIp要是碾壓另外兩族ai算不算是pimba(被拉走
作者: Adonisy (堂本瓜一)   2018-09-26 16:20:00
謝謝你告訴我12D轉大龍
作者: abc0922001 (中士abc)   2018-09-26 16:59:00
能打贏作弊難度的電腦很厲害欸
作者: qqq87112 (kaim)   2018-09-26 17:00:00
以為看到吃肉人族 先打電腦
作者: win4104 (BB)   2018-09-26 17:36:00
12D勝感覺...很靠賽
作者: firefoxriko (自由主義者的忠心測試)   2018-09-26 19:16:00
感覺ai條件比新人還差,新人還能上網找攻略,AI看攻略的話就被說作弊了。
作者: zseineo (Zany)   2018-09-26 19:33:00
因為目標不一樣啊XD
作者: firefoxriko (自由主義者的忠心測試)   2018-09-26 20:02:00
我只是想說這樣還打的贏很厲害,我看了攻略都沒能打贏
作者: kirimaru73 (霧丸)   2018-09-26 21:28:00
其實從來就沒有規定AI不能參考這個參考那個只是那隻狗Re:0的威能太大 所有人都會想拿來比一下
作者: wiki2548 (Wiki2548)   2018-09-26 21:30:00
期待像圍棋一樣能探索出一個全新的世界
作者: only1032 (螢幕小鍵盤)   2018-09-26 21:51:00
二樓好好笑
作者: shiyhsien (好人界終身成就獎)   2018-09-26 23:30:00
我APM只有100不到
作者: Mensholaten (REAL)   2018-09-26 23:33:00
星海的變化比圍棋複雜太多 要training很久才有可能適應各種情況吧
作者: rodney228 (繁星)   2018-09-27 03:54:00
看了一下,Bot1只是給了165個"基本概念"比如甚麼是挖礦攻擊的時候要點選目標、甚麼是科技之類的deepmind則是故意甚麼都不教?只是APM設計得有點太高了,職業選手也很難一直這樣更何況,學習戰術、操作一定程度之後,理論上Bot不會有操作失誤吧
作者: kira925 (1 2 3 4 疾風炭)   2018-09-27 08:25:00
Deepmind是故意什麼都不教 Bot1是先設定好了一點結構不是不可以拉 但是要詳細看到寫得多死
作者: jim8596 (休刊是童年的回憶)   2018-09-28 15:38:00
我還以為最強是ai是甩毒爆的槍兵而且rouge曾經出現2000apm過 限制不為過吧
作者: kira925 (1 2 3 4 疾風炭)   2018-09-28 15:43:00
那我用加速鍵盤丟蛋瞬間APM破萬也算嗎...
作者: amsmsk (449)   2018-09-28 21:58:00
2000APM是產單位吧

Links booklink

Contact Us: admin [ a t ] ucptt.com