Re: [閒聊] AI打星海爭霸,後來如何?

作者: ephraim13825 (好喔)   2022-08-30 18:50:40
看到很多人都講到AI靠操作這件事
因為大學時期有稍微了解做過報告 而且以前對這遊戲還滿有熱情的
https://imgur.com/xmSgUU7.jpg
雖然實力不是最高 但還是講一點自己的看法好了
先貼上相關網站文件 有興趣可以看一下
研究簡介
https://reurl.cc/dWy2rk
Paper
https://reurl.cc/V1MDXQ
那時候的研發背景是 AlphaGo在稱霸圍棋後 deepmind想往更深的領域挑戰
所以想試試看如果今天是走法不固定的RTS AI會怎麼去判斷
當時還很多人覺得AI只能在有限制的範圍內贏人類 在這種多變又要有地圖觀的遊戲
內是無法比過人類的
一開始的版本就是前面看到的比賽版本
全視野(沒有迷霧都能看到) 280APM(有效操作) 350ms延遲 等等
所以當時有許多爭議
1.正常人只能看到你畫面中的物件
AI可以同時觀看到所有能見的區域 所以就能多線同時對應
所以在最後一場把視野關掉後 AI才不像以前可以同時做多線判斷
而且被搞到不知道該守哪邊輸掉
2.人往往會做出無意義的操作
雖然官方的APM是280 比一般選手都還要低很多
但是AI走的是一次到位的判斷 人類卻會有多餘的動作
例如我今天要控制單位從A到B AI會這樣走
https://imgur.com/L5W4Xqm.jpg
但人類卻會是這樣走
https://imgur.com/nKg8zoC.jpg
同樣一個路徑上點好幾次慢慢往前 為了應付可能突然出現的意外
這樣造成明明是相同的判斷 普通人要比AI多花好幾倍的操作數去完成
因為開發者不一定懂遊戲 也不清楚實際的運作方式
所以在這次比賽結束後 deepmind重新思考了研究條件 並做出了幾個修改
只能對會面內的物件做判斷 且只能控制畫面內的單位
不只神族 而且三個種族同時進行訓練
與選手溝通 限制所有操作 反應時間 以至所呈現的結果都必須與人類相當
在修改完從新學習閉關修練後
https://reurl.cc/60dZWO
deepmind與暴雪合作 宣告會默默把AI投入進遊戲天梯對戰內 並隨機配對人類玩家
且會不斷換帳號 避免過多次來被發現是AI
結果在與人類同等的條件下 所有種族的AI都能爬到遊戲最高的宗師階級
且比遊戲內絕大部分的玩家強 這場AI對戰也就到這邊結束
結論就是就算是走法幾乎無限的RTS類遊戲 AI也能透過判斷來取勝
在這之後他們研究蛋白質應用在醫學領域又是另一個故事了
作者: bootes3177 (石榴姐姐)   2022-08-30 18:56:00
想到帥五進一
作者: oldriver (oldriver)   2022-08-30 19:01:00
投入魔獸世界 搞不好會比隨團隊友還強
作者: stu199712   2022-08-30 19:03:00
作者: rhox (天生反骨)   2022-08-30 19:05:00
我也有研究所同學做AI爬爐石天梯的研究
作者: chejps3105 (氋氃)   2022-08-30 19:05:00
我聽deepmind之前演講的說法是他們一開始用有戰爭迷霧發現訓練起來超爛,甚至連去找對手都不會,所以先全開訓練等到有階段性成果才把戰爭迷霧加回來。而不是他們不懂遊戲,他們內部工程師都有下去自己玩過
作者: ephraim13825 (好喔)   2022-08-30 19:08:00
我只的不懂是操作參數的部分他們可能認為280已經比絕大多數的選手低了 但不知道AI並不會有所謂的累贅動作 所以實際效果還是會被玩家強很多
作者: doremon1293 (模仿者)   2022-08-30 19:09:00
宗室是在那個服打的?
作者: ephraim13825 (好喔)   2022-08-30 19:09:00
*會比
作者: henry1234562 (亨利二十三)   2022-08-30 19:09:00
實際上280APM如果只是平均的也是沒啥用
作者: ephraim13825 (好喔)   2022-08-30 19:10:00
對 原本會戰會飆到1000 所以後面平均更最高都有調整到一般玩家水準
作者: doremon1293 (模仿者)   2022-08-30 19:11:00
AI操作不會失誤 小地圖不會漏看 就算一樣條件還是很有優勢
作者: shasen1236 (亞特蘭提斯のSsin)   2022-08-30 19:24:00
以前我也追星海好幾年,但如果只是設這簡單限制和靠勝負得到這個結果,其實意義也不大AI最大的意義在於是否能幫人類想出更好的決策,只有這種簡單限制對於AI的操作根本沒差,重點在於結論有沒有得出什麼時候該多線,分多少兵,或者該不該換家,單純上宗師的AI應該打從星海上市第一天就能做了
作者: ephraim13825 (好喔)   2022-08-30 19:28:00
主要還是測AI在沒有固定落點的遊戲會怎麼走 算是比棋盤遊戲進步更大了
作者: kira925 (1 2 3 4 疾風炭)   2022-08-30 19:31:00
當時結論好像天梯爬到五千多還六千多分吧 再上去就沒了但那個時候這遊戲也沒多少人了...APM280印象中也不是真的平均 那次比賽有瞬間拉出1500那個瞬間大家就知道整個訓練都歪了
作者: teller526 (大嘴巴)   2022-08-30 19:35:00
不過不得不說打天梯跟番戰還是差蠻多的 天梯雙方都可能不知道對方 但番戰就是雙方各種針對戰術
作者: ephraim13825 (好喔)   2022-08-30 19:37:00
平均280是因為平時只執行最低需求 不會像玩家一直瘋狂圈單位切畫面 所以很常在100左右 最高又不受限 才會不平衡 後續與選手討論調整成符合人類的標準
作者: km850105 (赤月之雙子)   2022-08-30 20:16:00
不過宗師也只是職業的等級而已接近本作級的職業選手會有7000up的分
作者: jjjj222 (綠色藥水)   2022-08-30 21:09:00
這個結果可以說明RTS主要就是打失誤的,壓迫造成對手失誤, 誰失誤少誰就贏了

Links booklink

Contact Us: admin [ a t ] ucptt.com