作者:
art1 (人,原來不是人)
2017-10-26 00:44:30: 推 win4104: 現在阿法狗團隊的瓶頸是 沒辦法把戰局優劣勢簡單實時的 10/25 15:23
: → win4104: 量化 10/25 15:23
不太懂為什麼沒辦法量化,去比較低、中、高階的記錄檔就可以發現一些很主要的差異
例如:資源量、有效操作量、資源交換比
為什麼 RTS 絕大部分提高遊戲 AI 難度都是靠著給 AI 更多資源?
一大主因就是資源量很重要,當你的資源比對手少時,你只能靠著提高資源交換比
來扳回資源差距,影響資源交換比的要素太多就先不討論,但若只是需要指標的話
,資源交換比絕對是需要列出來比較的
資源交換比就是你用了多少資源換掉對手多少資源,例如你不損一隻就全殲對手全部
軍事單位,這次交戰的資源交換比就是對手生產軍事單位所花掉的資源,去除以你用
來殲滅對手軍事單位所花掉的資源
有效操作量對電腦來說可能比較沒影響,因為電腦不會像人類一樣玩到後期很容易腦
袋空空,下出一些很沒意義的指令,不過有效操作量在哪個時間點該花在哪方面則是
需要深入研究
另一個很重要的是時間點,這邊用快攻來說明比較方便,假設一邊採取快攻,另一邊
採取爬科技,若快攻方在那邊一直屯兵,想說屯到數量夠了才進攻,結果夠了的時候
對方已經爬完科技,導致快攻方被高科技的兵屠殺
越早把資源用來生產軍事單位,越要確保你的資源交換比夠大,大到可以消耗或抵銷
對手先把資源用來拼經濟或科技所帶來的優勢;對手方則是反過來,盡可能地減少快
攻方的資源交換比
雖然比的還是資源交換比,但進攻時間點的選擇則是取決於你的戰術
從另一個角度來看,就是你花在軍事單位上的資源到開始有資源交換比的閒置時間有
多長,通常時間越長越不好,不過由於星海不封路的場次很少見,所以這數據未必能
用來當量化指標
通常資源量、資源交換比都贏對手的情況下,都是勝利的一方
作者:
win4104 (BB)
2017-10-26 00:55:00要評價的是 這個營運流程能不能得到更高的資源量這個操作是不是有效操作這樣的戰術選擇與配兵能不能得到更多的交換比五分鐘內是這樣 十分鐘後是嗎? 十五分鐘後是嗎?
那AI在蓋了一棟很貴的建築後就會投降了 因為資源見底
作者:
win4104 (BB)
2017-10-26 00:56:00同樣的操作在不同的情境下評價會不同而那個評價的依據還可能是來自還在戰場迷霧中的資訊
作者:
art1 (人,原來不是人)
2017-10-26 00:57:00以深度學習的做法來看,需要給的只有指標,剩下的靠訓練過程這邊說的資源量是累積的總量,不是目前手上擁有的資源
作者:
win4104 (BB)
2017-10-26 00:58:00Rts 沒有那麽單純 一隻兵站在某個點上 從不同的角度解釋可能是優 可能是劣局勢大體會跟資源 交換比這些成正相關 但這不是絕對你有可能存了200的資源跟部隊 但是因為沒反隱形被一隊隱刀 隱形女妖滅國
作者:
art1 (人,原來不是人)
2017-10-26 01:00:00目前 AI 需要的就是單純化的指標,不需要去考慮到太細
作者:
win4104 (BB)
2017-10-26 01:01:00或是照理來講應該能完勝的部隊在推進時被少量機動部隊換家數字依據終究只能作為參考 沒辦法當作評價局勢的重要依據
作者:
art1 (人,原來不是人)
2017-10-26 01:02:00建築物也是需要花掉資源,所以少量機動部隊抄家就是達成高的資源交換比
作者:
win4104 (BB)
2017-10-26 01:02:00如果只用這些單純的數字當指標 我相信AI會被多變的戰術耍的團團轉所以你要怎麼評價這個行動能不能得到更高的交換比對方可能在正面 可能不是 如果是 我推進能打贏 如果不是我推進有可能被換家那推進這個選項的評價是什麼
作者:
art1 (人,原來不是人)
2017-10-26 01:05:00靠深度學習的演算法,在經過大量訓練之後,電腦能找出最佳參數,以實現資源量、資源交換比的最大化
作者:
win4104 (BB)
2017-10-26 01:06:00那個簡單指標怎麼定義就是我說的問題所在Deepmind嘗試過讓AI以遊戲分數作為指標 結果AI從頭到尾只會採礦
最難的就是怎樣去定義出最好的指標呀..即時戰略會影響勝負的指標比圍棋多太多了
作者:
art1 (人,原來不是人)
2017-10-26 01:17:00如果你知道資源量、資源交換比跟勝率有正相關,為什麼不想以這兩個為簡單指標呢?你是用局勢跟那兩者有關
作者:
win4104 (BB)
2017-10-26 01:33:00資源交換比跟勝率有正相關這也是必須參考其他情境分析不適用於所有情境
作者:
art1 (人,原來不是人)
2017-10-26 06:03:00所以簡單指標必須適用於所有情境? 這是找指標的前提嗎?
作者:
win4104 (BB)
2017-10-26 09:24:00如果你的指標代表性不夠 那就不是個好的指標目標是要贏 如果達成指標卻沒能提高勝率 那要這個指標何用
作者:
miname (>.<)
2017-10-26 10:11:00圍棋一樣沒辦法知道每一步的優劣啊,AGZ是用蒙地卡羅搜尋不同落子點的勝率來做訓練的
作者:
win4104 (BB)
2017-10-26 10:46:00關於推文提到的一些問題,其實總歸就是把人類行為規則找出來而已,目前各類自動化工程都類似這個狀況,所以近年AI突破一個階段就是神經學有所發展導致的,知道規則怎麼跑,AI最簡單的其中一項目標就是複製人類行為所以有些問題不是問題
作者:
art1 (人,原來不是人)
2017-10-26 12:36:00什麼時候已經證明資源量、資源交換比這兩個指標無法提高勝率
作者:
win4104 (BB)
2017-10-26 12:40:00同樣一個問題反過來問你呢?如果這些指標這麼有效 Deepmind會沒想到?會出現只會飛基地追求和局 跟只採礦追求分數這兩種狀況?這兩個是Deepmind目前研究已經發生的狀況
作者:
art1 (人,原來不是人)
2017-10-26 12:50:00出現的那兩種狀況有註明說是用了哪些指標?我是不知道他們有沒有想到那兩個指標,因為他們沒說所以我不會當成他們已經想過了
作者:
win4104 (BB)
2017-10-26 12:57:00第一個是勝利 第二個是星海本身的遊戲積分機制再問個問題 是優勢造成交換比上升 還是交換比上升造成優勢? 根本的原因是什麼 還是看到的只是結果資源 有效操作EPM 跟戰損比 都是星海系統自己已經算好給你的數字連自己另外算都不用我不覺的他們會沒試過
居然有人認為坐在ptt前想到的東西 專業研究人員沒想過