我寫個懶人包好了
1. 微信id: almosthuman2014 的看法
AlphaStar (AS) 雖然限制了APM,但AS在同樣的APM限制下,
有效APM (Effective APM) 比人類高很多。
除此之外,即便純看APM,職業選手 Serral 維持 800 APM 1秒鐘已經超強,
但是 AS 可以做到 1000+ APM 持續5秒。
所以這個微信作者認為DeepMind解說人員講述「AS如何能夠完成人類可以做的事情」的
過程非常粗糙。為什麼 DeepMind 允許 AS 擁有超人的操作能力?
DeepMind裡面肯定有人看得出操作太強。那為什麼不給予更強的APM限制?
作者認為應該是因為有某些因素造成如果不放寬APM限制這實驗會做不下去
所以他覺得這場live show 公關的意味濃厚,甚至有誤導的嫌疑
2. FB 機器學習科學家 田淵棟 的看法
田主要是講了些 reinforcement learning 上與 AS 相關的知識 (我也不是很懂)。
相較於圍棋這種資訊完全透明的比賽,SC2的臨時建模和分析會比較沒那麼容易。
目前 reinforcement learning 有相當多沒解決的問題,
可以說他有很大的侷限性,但也可以說他潛力巨大。
就現在SC2的情況來說,人類在全域戰略上的悠化效率比AS高很多,
比如說一句「做兩個鳳凰去打那個來空投的Prism」,可能等於AS自己對戰幾天幾夜
這個效率的差距(可能是指數級的)是否可以用大量計算資源去填補,
會是和頂尖高手對橘勝敗的關鍵