[情報] DeepMind 和 Blizzard 發表 AI 環境

作者: LCamel (LCamel)   2017-08-10 09:46:56
DeepMind and Blizzard open StarCraft II as an AI research environment
Wednesday, 9 August 2017 (縮 https://goo.gl/KSfFFa )
DeepMind (世界最強圍棋 AI 那家) 和 Blizzard 共同發表新的 AI 開發環境,
"SC2LE" , 其中包括了:
* A Machine Learning API developed by Blizzard that gives researchers
and developers hooks into the game. This includes the release of tools
for Linux for the first time.
Blizzard 公開一套給機器學習用的接口
https://github.com/Blizzard/s2client-proto
The StarCraft II API is an interface that provides full external control
of StarCraft II.
可以讓外部程式控制 SC2.
This API exposes functionality for developing software for:
這套接口可以用來開發:
* Scripted bots. 寫死規則的傳統 bot
* Machine-learning based bots. 機器學習的 bot
* Replay analysis. 分析 replay 錄影 (才知道高手怎麼玩)
* Tool assisted human play. 人玩, 同時工具在旁協助 (這沒問題嗎?)
The API is available in the retail Windows and Mac clients.
There are also Linux clients available at the download links below.
零售版的 Windows / Mac 星海可用. Linux 也有.
* A dataset of anonymised game replays, which will increase from 65k
to more than half a million in the coming weeks.
將陸續公開超過 50 萬場 replay 來讓大家有得學.
* An open source version of DeepMind’s toolset, PySC2,
to allow researchers to easily use Blizzard’s feature-layer API
with their agents.
https://github.com/deepmind/pysc2
"... It exposes Blizzard Entertainment's StarCraft II
Machine Learning API as a Python RL Environment."
把上述接口包成 python 語言可以用的強化學習環境.
* A series of simple RL mini-games to allow researchers to test
the performance of agents on specific tasks.
一些讓研究者可測試的小任務.
採礦採礦 生兵生兵
https://www.youtube.com/watch?v=6L448yg0Sm0
* A joint paper that outlines the environment, and reports initial
baseline results on the mini-games, supervised learning from replays,
and the full 1v1 ladder game against the built-in AI.
https://deepmind.com/documents/110/sc2le.pdf
一篇兩家公司共同發表的目前成果, 作為大家開始的起點.
影片中右邊的訓練成果看起來還有模有樣的呢:
https://www.youtube.com/watch?v=WEOzide5XFc
LCamel
作者: kira925 (1 2 3 4 疾風炭)   2017-08-10 09:48:00
為什麼要在礦區蓋BS...XD
作者: abc0922001 (中士abc)   2017-08-10 09:54:00
AI常常會下出與自身常識不符合的動作萬一這樣採礦效率比較高呢XDDD
作者: EGsux (天龍人)   2017-08-10 09:56:00
那個只是在訓練裡的動作 不是在對戰
作者: kira925 (1 2 3 4 疾風炭)   2017-08-10 10:12:00
是可以理解對T來說可以偷一咪咪的來回時間拉但是卡到的時間成本大概沒被計入...
作者: azureblaze (AzureBlaze)   2017-08-10 10:17:00
因為還只是初學者
作者: kira925 (1 2 3 4 疾風炭)   2017-08-10 10:26:00
有趣的是 為什麼現在都只看到人族?
作者: lovinlover (Lovin Lover)   2017-08-10 10:29:00
因為呂布是人族
作者: lather (煞氣ㄟ溺水)   2017-08-10 10:58:00
因為t可以多線投到你崩潰
作者: azureblaze (AzureBlaze)   2017-08-10 11:15:00
因為目標只有生馬林 PZ生不出馬林 T IMBA
作者: teren (blank)   2017-08-10 11:17:00
因為AI認證的TIMBA
作者: itsdelovely (It's De-Lovely)   2017-08-10 11:19:00
cool!
作者: APM99 (血統純正台北人)   2017-08-10 11:22:00
影片中的AI是學了50萬場青銅組的錄像嗎 ...
作者: win4104 (BB)   2017-08-10 11:25:00
因為這個AI不像我們有十幾年的遊戲經驗他沒有一般玩家的遊戲直覺吧
作者: abc0922001 (中士abc)   2017-08-10 11:37:00
可能是DeepMind沒買序號,只能玩免費的XDDD
作者: luckhunter (大番薯)   2017-08-10 11:41:00
因為人類的操作空間在AI下可以無限大
作者: kira925 (1 2 3 4 疾風炭)   2017-08-10 11:47:00
那個AI只有採礦一個任務
作者: FallenAngelX (跌倒)   2017-08-10 11:48:00
Tool assisted human play應該意思是用工具輔助達成 人類理論上可以辦到的完美play就像是Tool assisted speedrun (TAS) 也都是人玩的但實際上根本玩不出來 XD
作者: gmoz ( This can't do that. )   2017-08-10 11:59:00
API也出了XD
作者: eggli (eggli)   2017-08-10 12:00:00
作者: gmoz ( This can't do that. )   2017-08-10 12:02:00
借轉八卦?
作者: eggli (eggli)   2017-08-10 12:03:00
貼個[天網]tag (誤
作者: positMIT (MarineQueen)   2017-08-10 12:50:00
push!
作者: DevilEnvy (條列式王)   2017-08-10 12:55:00
比較想看兩個頂級外掛AI打的操作
作者: positMIT (MarineQueen)   2017-08-10 13:17:00
untrained AI----->trained AI----->>innovation
作者: homelife (SKY)   2017-08-10 13:34:00
這些工具可以讓一般人做出什麼呢? 類似可以在自訂開遊戲然後讓AI自己操控電腦打嗎?
作者: kira925 (1 2 3 4 疾風炭)   2017-08-10 13:38:00
給想要玩AI開發的人可以玩
作者: abc0922001 (中士abc)   2017-08-10 13:45:00
一般人也可以創造AI阿
作者: win4104 (BB)   2017-08-10 14:37:00
我講的直覺是GameSence 也是透過遊戲經驗的累積透過參考過往的經驗來分析 這點應該跟AI的學習是一致的
作者: kira925 (1 2 3 4 疾風炭)   2017-08-10 14:57:00
確實是一致的 訓練AI的時候會有個模擬獎賞的機制鼓勵AI的類神經網路權值矩陣 只是RTS因為戰爭迷霧讓他變複雜
作者: shasen1235 (Ssin)   2017-08-10 15:21:00
Bug report:Shu Dong Huang
作者: tasin (Ringo)   2017-08-10 15:29:00
快贏得時候砸AI礦螺 它會學起來嗎
作者: gouran (群爭)   2017-08-10 16:23:00
太陽拳!!!
作者: JokerRF (RF)   2017-08-10 18:05:00
AI:干死黃旭東
作者: Pony5566 (Luna Akbar)   2017-08-10 19:08:00
AI不知道會不會受到四川神祕力量影響
作者: kane111 (kane)   2017-08-10 20:13:00
星海操作的影響程度太大,不知道最後怎麼樣評斷訓練的結果
作者: Timba (踢音霸)   2017-08-10 22:34:00
狂!!!!! 他會不會模仿對手阿???輸了時候 都被丟礦螺 贏的時候會不會也學起來??
作者: vul3kuo (Glory)   2017-08-10 22:45:00
期待看到像圍棋那樣 出現顛覆常理的玩法
作者: shentis (夜寅)   2017-08-10 23:24:00
說不定後面知道自己快贏了,一堆工兵跑到對手家噴漆XD
作者: KillerMoDo (你媽知道你在發廢文嗎)   2017-08-10 23:34:00
可能會來比個 執政官 阿法狗:可以投降了 玩家:我不要阿法狗默默的放推
作者: h311013   2017-08-11 01:29:00
大衛精一調整 AI武功盡失 XD
作者: jyunwei (jyunwei)   2017-08-11 11:40:00
操作除了分鐘操作數以外會不會點錯也是影響
作者: gmoz ( This can't do that. )   2017-08-11 12:54:00
理論上不會點錯
作者: banmi (數學小天兵)   2017-08-11 15:31:00
照這樣發展下去,不知道有沒有一天會出現天網??
作者: kira925 (1 2 3 4 疾風炭)   2017-08-11 16:48:00
AI是不會點錯的阿....
作者: aegis43210 (宇宙)   2017-08-11 20:12:00
AI要發展營運策略可能還要一段時間
作者: oldTim (TIME WILL TELL)   2017-08-11 21:00:00
這篇可以讓圍棋界那些瞧不起星海的人閉嘴了論文上Deepmind試了各種不同的深度學習架構,結果根本沒用只有在某些mini-game裡面才能訓練出職業等級的操作要打full game還打不過暴雪內建AI,看來Deepmind沒辦法了所以開源來請大家集思廣益。

Links booklink

Contact Us: admin [ a t ] ucptt.com