Re: [閒聊] AI打星海爭霸,後來如何?

作者: ephraim13825 (好喔)   2022-08-30 18:50:40
看到很多人都講到AI靠操作這件事
因為大學時期有稍微了解做過報告 而且以前對這遊戲還滿有熱情的

雖然實力不是最高 但還是講一點自己的看法好了
先貼上相關網站文件 有興趣可以看一下
研究簡介
https://reurl.cc/dWy2rk
Paper
https://reurl.cc/V1MDXQ
那時候的研發背景是 AlphaGo在稱霸圍棋後 deepmind想往更深的領域挑戰
所以想試試看如果今天是走法不固定的RTS AI會怎麼去判斷
當時還很多人覺得AI只能在有限制的範圍內贏人類 在這種多變又要有地圖觀的遊戲
內是無法比過人類的
一開始的版本就是前面看到的比賽版本
全視野(沒有迷霧都能看到) 280APM(有效操作) 350ms延遲 等等
所以當時有許多爭議
1.正常人只能看到你畫面中的物件
AI可以同時觀看到所有能見的區域 所以就能多線同時對應
所以在最後一場把視野關掉後 AI才不像以前可以同時做多線判斷
而且被搞到不知道該守哪邊輸掉
2.人往往會做出無意義的操作
雖然官方的APM是280 比一般選手都還要低很多
但是AI走的是一次到位的判斷 人類卻會有多餘的動作
例如我今天要控制單位從A到B AI會這樣走

但人類卻會是這樣走

同樣一個路徑上點好幾次慢慢往前 為了應付可能突然出現的意外
這樣造成明明是相同的判斷 普通人要比AI多花好幾倍的操作數去完成
因為開發者不一定懂遊戲 也不清楚實際的運作方式
所以在這次比賽結束後 deepmind重新思考了研究條件 並做出了幾個修改
只能對會面內的物件做判斷 且只能控制畫面內的單位
不只神族 而且三個種族同時進行訓練
與選手溝通 限制所有操作 反應時間 以至所呈現的結果都必須與人類相當
在修改完從新學習閉關修練後
https://reurl.cc/60dZWO
deepmind與暴雪合作 宣告會默默把AI投入進遊戲天梯對戰內 並隨機配對人類玩家
且會不斷換帳號 避免過多次來被發現是AI
結果在與人類同等的條件下 所有種族的AI都能爬到遊戲最高的宗師階級
且比遊戲內絕大部分的玩家強 這場AI對戰也就到這邊結束
結論就是就算是走法幾乎無限的RTS類遊戲 AI也能透過判斷來取勝
在這之後他們研究蛋白質應用在醫學領域又是另一個故事了
作者: bootes3177 (石榴姐姐)   2022-08-30 18:56:00
想到帥五進一
作者: oldriver (oldriver)   2022-08-30 19:01:00
投入魔獸世界 搞不好會比隨團隊友還強
作者: stu199712   2022-08-30 19:03:00
作者: rhox (天生反骨)   2022-08-30 19:05:00
我也有研究所同學做AI爬爐石天梯的研究
作者: chejps3105 (氋氃)   2022-08-30 19:05:00
我聽deepmind之前演講的說法是他們一開始用有戰爭迷霧發現訓練起來超爛,甚至連去找對手都不會,所以先全開訓練等到有階段性成果才把戰爭迷霧加回來。而不是他們不懂遊戲,他們內部工程師都有下去自己玩過
作者: ephraim13825 (好喔)   2022-08-30 19:08:00
我只的不懂是操作參數的部分他們可能認為280已經比絕大多數的選手低了 但不知道AI並不會有所謂的累贅動作 所以實際效果還是會被玩家強很多
作者: doremon1293 (模仿者)   2022-08-30 19:09:00
宗室是在那個服打的?
作者: ephraim13825 (好喔)   2022-08-30 19:09:00
*會比
作者: henry1234562 (亨利二十三)   2022-08-30 19:09:00
實際上280APM如果只是平均的也是沒啥用
作者: ephraim13825 (好喔)   2022-08-30 19:10:00
對 原本會戰會飆到1000 所以後面平均更最高都有調整到一般玩家水準
作者: doremon1293 (模仿者)   2022-08-30 19:11:00
AI操作不會失誤 小地圖不會漏看 就算一樣條件還是很有優勢
作者: shasen1236 (亞特蘭提斯のSsin)   2022-08-30 19:24:00
以前我也追星海好幾年,但如果只是設這簡單限制和靠勝負得到這個結果,其實意義也不大AI最大的意義在於是否能幫人類想出更好的決策,只有這種簡單限制對於AI的操作根本沒差,重點在於結論有沒有得出什麼時候該多線,分多少兵,或者該不該換家,單純上宗師的AI應該打從星海上市第一天就能做了
作者: ephraim13825 (好喔)   2022-08-30 19:28:00
主要還是測AI在沒有固定落點的遊戲會怎麼走 算是比棋盤遊戲進步更大了
作者: kira925 (1 2 3 4 疾風炭)   2022-08-30 19:31:00
當時結論好像天梯爬到五千多還六千多分吧 再上去就沒了但那個時候這遊戲也沒多少人了...APM280印象中也不是真的平均 那次比賽有瞬間拉出1500那個瞬間大家就知道整個訓練都歪了
作者: teller526 (大嘴巴)   2022-08-30 19:35:00
不過不得不說打天梯跟番戰還是差蠻多的 天梯雙方都可能不知道對方 但番戰就是雙方各種針對戰術
作者: ephraim13825 (好喔)   2022-08-30 19:37:00
平均280是因為平時只執行最低需求 不會像玩家一直瘋狂圈單位切畫面 所以很常在100左右 最高又不受限 才會不平衡 後續與選手討論調整成符合人類的標準
作者: km850105 (赤月之雙子)   2022-08-30 20:16:00
不過宗師也只是職業的等級而已接近本作級的職業選手會有7000up的分
作者: jjjj222 (綠色藥水)   2022-08-30 21:09:00
這個結果可以說明RTS主要就是打失誤的,壓迫造成對手失誤, 誰失誤少誰就贏了

Links booklink

Contact Us: admin [ a t ] ucptt.com