[外絮] 騰訊最新AI在SC2上擊敗作弊電腦 andy920262 PTT批踢踢實業坊

[外絮] 騰訊最新AI在SC2上擊敗作弊電腦

作者: andy920262 (andy920262) 2018-09-26 14:23:15

原始論文：
https://arxiv.org/pdf/1809.07193v1.pdf
我本身是SC2玩家也對AI稍有研究，最近剛好看到這篇上禮拜才發表的論文，台灣似乎還沒什麼新聞或討論。
這篇應該是目前第一篇“公開”研究聲稱可以“進行整場遊戲並擊敗玩家”的論文，先前SC2的研究都是只能進行小遊戲的程度。
簡單來講，騰訊發表了2個不同的AI稱為TStarBot1跟TStarBot2在深海礁岩這張地圖進行ZvZ遊戲，APM限制在400-800。
TStarBot1是跟電腦對局了700萬場自我學習的，TStartBot2則是沒有經過學習直接被人類給予規則的AI(Rule-base AI)。
這兩隻AI對上作弊電腦分別取得80%跟90%的勝率，並成功擊敗白金~鑽石段位的玩家(不過場次很少)。
不過論文中有提到，TStarBot1在玩了700萬場後學到勝率最高的招式是異化蟲快攻，因此對上真實玩家多打幾場就會被破解。
而TStarBot2使用的戰術就比較多元，但以AI研究的角度來看，Rule-base AI就只是根據人類賦予的知識進行遊戲，並沒有辦法自行學習更強的戰術，因此現在的AI研究多半是自我學習為重點。
技術細節的部分我就不提了，有興趣了解的可以推文我盡量解答。
重點就是現在SC2 AI的研究還只能打打電腦，先前天梯高端有AI出沒的傳言多半是假的，不然就是除了騰訊外有其他尚未公開的研究在測試，雖然個人認為機率不高就是了。

作者: homelife (SKY) 2018-09-26 14:45:00

之前在API發表之後，Deepmind玩SC2似乎都還沒有消息?

作者: ws870325 (不懂) 2018-09-26 14:45:00

700萬場只會12d???

作者: kira925 (1 2 3 4 疾風炭) 2018-09-26 14:48:00

700萬場的Z學會了一個12D...而且是ZvZ...

作者: eternalviva (è€äºº) 2018-09-26 14:51:00

應該不是只學會12D 而是12D效率最佳 XD學T的時候大概也是每一場2BB

作者: homelife (SKY) 2018-09-26 15:00:00

沒有讀檔案內文，但如果是照AlphaGO的模式，一開始應該是從AI連規則都不清楚就讓他自己摸索?

作者: fragmentwing (片翼碎夢) 2018-09-26 15:10:00

deepmind的不是還在人族建築起飛戰術？

作者: lather (煞氣ㄟ溺水) 2018-09-26 15:13:00

2bb 12D 野bg 應該都是最高的博弈心態再加上操作

作者: kira925 (1 2 3 4 疾風炭) 2018-09-26 15:16:00

400~800APM也太高了 200~400才合理吧看了下內容他直接做了165個Macro 換句話說他已經先綁好AI會做什麼子動作了...不能說偷雞拉因為確實這些動作是可以先設定好的但是就不是從0開始

作者: penut85420 (PenutGGorz) 2018-09-26 15:22:00

我覺得一開始有些Marco應該還算合理，如果一出世就有個Rule Base而且沒綁腳本感覺有點太可怕。不過很看好他的前景，期許有天可以改善遊戲內建的AI，甚至有機會指導玩家哪些細節需要改善發現筆誤，不是說Rule Base而是只有純輸入Rule

作者: aegis43210 (宇宙) 2018-09-26 15:40:00

強化獎勵的部份最難

作者: zero790425 (ULTIMATE) 2018-09-26 16:00:00

AIp要是碾壓另外兩族ai算不算是pimba(被拉走

作者: Adonisy (堂本瓜一) 2018-09-26 16:20:00

謝謝你告訴我12D轉大龍

作者: abc0922001 (中士abc) 2018-09-26 16:59:00

能打贏作弊難度的電腦很厲害欸

作者: qqq87112 (kaim) 2018-09-26 17:00:00

以為看到吃肉人族先打電腦

作者: win4104 (BB) 2018-09-26 17:36:00

12D勝感覺...很靠賽

作者: firefoxriko (自由主義者的忠心測試) 2018-09-26 19:16:00

感覺ai條件比新人還差，新人還能上網找攻略，AI看攻略的話就被說作弊了。

作者: zseineo (Zany) 2018-09-26 19:33:00

因為目標不一樣啊XD

作者: firefoxriko (自由主義者的忠心測試) 2018-09-26 20:02:00

我只是想說這樣還打的贏很厲害，我看了攻略都沒能打贏

作者: kirimaru73 (霧丸) 2018-09-26 21:28:00

其實從來就沒有規定AI不能參考這個參考那個只是那隻狗Re:0的威能太大所有人都會想拿來比一下

作者: wiki2548 (Wiki2548) 2018-09-26 21:30:00

期待像圍棋一樣能探索出一個全新的世界

作者: only1032 (螢幕小鍵盤) 2018-09-26 21:51:00

二樓好好笑

作者: shiyhsien (好人界終身成就獎) 2018-09-26 23:30:00

我APM只有100不到

作者: Mensholaten (REAL) 2018-09-26 23:33:00

星海的變化比圍棋複雜太多要training很久才有可能適應各種情況吧

作者: rodney228 (繁星) 2018-09-27 03:54:00

看了一下，Bot1只是給了165個"基本概念"比如甚麼是挖礦攻擊的時候要點選目標、甚麼是科技之類的deepmind則是故意甚麼都不教?只是APM設計得有點太高了，職業選手也很難一直這樣更何況，學習戰術、操作一定程度之後，理論上Bot不會有操作失誤吧

作者: kira925 (1 2 3 4 疾風炭) 2018-09-27 08:25:00

Deepmind是故意什麼都不教 Bot1是先設定好了一點結構不是不可以拉但是要詳細看到寫得多死

作者: jim8596 (休刊是童年的回憶) 2018-09-28 15:38:00

我還以為最強是ai是甩毒爆的槍兵而且rouge曾經出現2000apm過限制不為過吧

作者: kira925 (1 2 3 4 疾風炭) 2018-09-28 15:43:00

那我用加速鍵盤丟蛋瞬間APM破萬也算嗎...

作者: amsmsk (449) 2018-09-28 21:58:00

2000APM是產單位吧

繼續閱讀

[情報] TaeJa重新加入Team Liquidrichard82010 [聯賽] BZS:May(熾熱青春) 例行賽 #17AzureRush [情報] 本週異變：長眠安息fragmentwing [實況] 一個有趣的比賽LWC0227 [專訪] 已為人父的人類皇太子「惡魔羊」DScain1187 [情報] StarCrafts Season 6 Ep 18 Deep Troublefragmentwing [問題] 泉水溝戰術再現?!! ZvZ 猥瑣戰術orange0319 [實況] 臺灣蟲王 SEn (收播)OldYellowDog OSC直播LWC0227 [問題] 早期工兵鬧礦到底是從何時開始的?orange0319