Re: [情報] 機器之心報導DeepMind AlphaStar

作者: yoyoyin0119 (UnSeenBlade)   2019-01-25 15:19:33
我覺得AlphaStar訓練得有點歪掉了欸……
大家想得到的訓練成果
應該是AI能夠像人類一樣
制定策略
預測對手行動
執行戰術並反制對手戰術
靈活的隨機應變能力
從這些層面來擊敗人類選手獲得勝利
結果這幾場看下來
AlphaStar練成的是戰術普普但是操作爆幹強
秀出人類根本做不到的微控來獲勝
但是這點在很久以前就有AI能做到了呀
何必訓練一個AlphaStar來做到一樣的事情
是不是因為為了訓練方便直接讓它讀取API,也沒特別限制手速
結果它找到最能獲勝的手段就是直接用控兵幹贏?
畢竟星海是設計給人來玩的
當初可不會設想到如果有手速是選手好幾倍的超人來玩
會把遊戲玩成什麼樣子……
作者: panruru1224 (boored)   2019-01-25 15:21:00
你要考慮在訓練過程AS(除了一開始的imitation以外)AS並不知道人類的玩法 而是AS互打 這表示這類型的
作者: mrmowmow (mow)   2019-01-25 15:22:00
因為你說的早就有的ai的基本戰略是人類key進去的,deepmind是自己學習這基本戰略
作者: panruru1224 (boored)   2019-01-25 15:22:00
戰術在雙方手速相當的時候還是很好的戰術
作者: arrenwu (鍵盤的戰鬼)   2019-01-25 15:26:00
我是覺得AS不是訓練來玩遊戲的啦先把AS訓練成「靠著神猛操作屌壓人類」這目標沒錯因為目前還做不到
作者: Jotarun (forever)   2019-01-25 15:36:00
你真要知道他怎麼控制 先把這篇看完http://bit.ly/2WitmMy然後訓練成怎樣本來就是未知的
作者: homelife (SKY)   2019-01-25 15:53:00
昨天看完直播並不覺得每場都只靠控兵阿,真的誇張的不是只有360度追獵那場嗎? 另一場AI裂光球還誤炸自己好幾次
作者: martinmask (Michael)   2019-01-25 16:22:00
有沒有視頻連結
作者: azeroth (呆腦羊咩咩)   2019-01-25 16:24:00
VOD前面幾篇有
作者: z83420123 (VoLTsRiNe)   2019-01-25 16:25:00
誤炸自己好幾次那是第一週第一週操作看的出來沒訓練好 會戰有點忙不過來但第二週那操作就不開玩笑了第一週那個大家更多還是吐槽tlo在打三小 第二週被那操作看傻了
作者: jim8596 (休刊是童年的回憶)   2019-01-25 16:28:00
隱刀那場輸在操作 好奇被大招電腦要怎麼解
作者: richard82010 (HatsuneMiku)   2019-01-25 16:52:00
或是AS經過百萬場對戰發現自己最強的方式就是提高所有單位的生存率,而最容易達成的方式就是驚人的微操.....利用自己絕對不會點歪的優勢
作者: Raikknen (Kimi)   2019-01-25 16:52:00
你不得不承認AI學習能力是飛快進步的
作者: hijacker (懶人一枚)   2019-01-25 16:54:00
他的微操也是靠學習來的啊
作者: penut85420 (PenutGGorz)   2019-01-25 17:10:00
因為贏得勝利的一方通常操作都很好
作者: toya123 (雷姆在我床上 閉嘴)   2019-01-25 17:10:00
一定是韓國人帶壞阿法星的
作者: yeldnats (夜那)   2019-01-25 17:21:00
其實只是控兵很誇張奪走目光,看到360追獵就認為是靠微操,不過多面夾擊優勢雖然對人是常識,要AI自己學習出來卻是困難的
作者: willtaiwan (台灣能)   2019-01-25 17:29:00
很多亮點,他會分兵守先知,被菱鏡不朽弄到還是有應對,只是不是最佳應對
作者: miha80425 (ohsialay)   2019-01-25 17:37:00
說到底RTS是操作遊戲 圍棋限時下子差多了極限大概就是防守應對 以最低代價獲得優勢+高效操作碾想看到的AI戰略思維似乎是沒有
作者: nissptt (niss)   2019-01-25 17:41:00
樓主要說的是"戰略普普"吧?對應戰爭。?縮小一級才是戰術,對應戰役。操作又更小一級, 對應哪個詞彙我不清楚。至於跨小分,不同局的應對,AI應該不如真人。
作者: angeltear15 (嘉明湖)   2019-01-25 17:41:00
花兩年弄出悍馬2000 真的廢到笑
作者: ohmylove347 (米特巴爾)   2019-01-25 17:45:00
已經很強了,這個進步是大家難以想像的快,我們幾代的超猛AI就快來了不用擔心
作者: miha80425 (ohsialay)   2019-01-25 17:47:00
媽的 大失業時代真的要來了XD
作者: Jotarun (forever)   2019-01-25 17:48:00
廢到笑的是不懂內涵覺得這個廢的人吧 LUL
作者: miha80425 (ohsialay)   2019-01-25 17:54:00
現在商用AI可以從只回答一個問題到分辨不同問題回答再進化一點 客服人員真的沒飯吃
作者: TFsonG   2019-01-25 17:55:00
還有很長一段路要走
作者: peanutman (偷~~島~~林)   2019-01-25 18:11:00
想看AI打Has XD
作者: Jotarun (forever)   2019-01-25 18:15:00
客服AI 喔 那個真的是廢到笑
作者: qoo60606 (凜)   2019-01-25 18:18:00
演算法不知道用哪些 很有趣
作者: Jotarun (forever)   2019-01-25 18:23:00
主要的演算法DeepMindblog有寫 可以找我的兩篇文都有連結
作者: hikerLin (自慢)   2019-01-25 18:28:00
AI被針對弱點之後怎麼自動學習改進才是想看的
作者: qoo60606 (凜)   2019-01-25 18:48:00
只看得懂是深度神經網路 其他不懂了qq
作者: tasin (Ringo)   2019-01-25 18:52:00
操作學習上我也覺得佔得太多導致ai的配兵從tlo的版本到mana的版本反而越來越單純雖然她會拉陣 包夾真的很屌
作者: WindSpread (陽だまりの詩)   2019-01-25 18:54:00
AS:SIMPLE IS BEST (blinkblinkblink
作者: zephyr (斷了線的風箏)   2019-01-25 18:57:00
應該可以透過參數調整再訓練 現在的條件 好的解是靠操作但重點是七天練兩百年的流程已經建立起來了訓練條件不同可能就會生出其他的最佳解
作者: qoo60606 (凜)   2019-01-25 19:01:00
作者: LochtsStorM (Lochts)   2019-01-25 19:39:00
打的目的就是要順便看看大家的想法說廢到笑的還滿可憐的
作者: catmeat777 (多蘿喵)   2019-01-25 19:52:00
說廢的連AI都打不贏,不意外
作者: confucamus   2019-01-25 19:59:00
操作也是建立在營運沒有問題的情況下好嗎,不然找個可以這樣營運的的來看看,悍馬2000有做到這個嗎?
作者: APM99 (血統純正台北人)   2019-01-25 19:59:00
兩年前就說過DeepMind 選錯遊戲了 星海2是操作為主的遊戲DeepMind 當初就該去選沒有'a'的即時戰略遊戲 可是不少阿只是那些遊戲都沒玩家了^^Maru或Serral 依靠的都是操作取勝 論策略預測執行靈活這篇推文抽十個 說不定都能有五個比這兩位頂尖選手強
作者: fragmentwing (片翼碎夢)   2019-01-25 20:28:00
覺得戰術搭配到敵我手速差別也不是不行不過這得有個度故意讓對方要用高手速來互拼的當然可以但是不是靠手速萬解打法serral、maru也算很會變換戰術和心理戰的選手了
作者: z83420123 (VoLTsRiNe)   2019-01-25 20:38:00
這篇推文論策略預測執行靈活我可以說一個都不會有比他們強
作者: fragmentwing (片翼碎夢)   2019-01-25 20:39:00
八卦是 剛剛看到TLO手速也飆到1350過w
作者: Jotarun (forever)   2019-01-25 20:39:00
光沒玩家這件事就不行啊 這已經是賠錢生意 連知名度都沒
作者: kira925 (1 2 3 4 疾風炭)   2019-01-25 20:39:00
阿那個就刷出來的東西 不一樣的
作者: Jotarun (forever)   2019-01-25 20:40:00
還搞啥 而且操作也是要學習的 又不是亂按按的快就行看之前其他AI打起來都什麼鬼樣子就可以知道這個問題的難度 人家看上的也是難度話說Facebook上次圍棋輸 這次SC2也是暫時落後蠻多的不知道Lecun私底下會不會發飆XD
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 20:51:00
如果每個人都知道DeepMind是什麼意思 就不會有人以為AI是靠手速贏的
作者: kira925 (1 2 3 4 疾風炭)   2019-01-25 20:51:00
FB好像是去玩星海一的AI 不過....第一名也沒拿到XD不 AI昨天確實就是用手速贏的 他的戰略很明確 因為有可靠的高手速 所以他的戰略就是純粹堆追獵然後拼操作強壓當然這個跟簡化成"AI只是會操作"有點微妙的不同但是要說這個不是靠手速...他是靠手速阿
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 20:54:00
那就是你只知道表面了 很高興你自告奮勇的解釋
作者: APM99 (血統純正台北人)   2019-01-25 20:54:00
這跟表面無關 這跟遊戲本質有關 這遊戲本來就是靠操作
作者: kira925 (1 2 3 4 疾風炭)   2019-01-25 20:55:00
我想這邊已經辯論過兩輪到底怎樣了 半途跳出來喊你們不懂呵呵呵
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 20:56:00
DeepMind一定要選星海這種複雜度夠高的RTS 才能代表他真的有學到東西所謂的DeepMind就是為了跟一般的學習型AI做區分:如果開發團隊有照著定義的話 DeepMind是指人類從來沒有教他要做什麼 甚至不應該給他棋譜/RP 而是單純讓他學習星海是什麼樣的遊戲 告訴她操作方法後 讓他自己去跑 也就是
作者: kira925 (1 2 3 4 疾風炭)   2019-01-25 20:59:00
好 現在我們明確知道是誰只知道表面了
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:00:00
說DeepMind是在不知道大家怎麼玩星海的前提下去打到現
作者: paul012011 (小全)   2019-01-25 21:00:00
k大前面的意思是 因為手速設定的問題 理論上應該要鑽研戰略的AI一頭鑽進去生基本兵後瘋狂微操
作者: KTZest (P7GAB)   2019-01-25 21:01:00
這個AI打得贏韓國頂尖神族嗎?
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:02:00
人類想像的戰略 這樣不能否定從無到有的這種驚人的自學成果
作者: miha80425 (ohsialay)   2019-01-25 21:03:00
AI沒有聰明到會證1+1 他會找最簡單的方式解決但是人類想讓AI變到會證1+1 而不是直接給2這個答案用這例子解釋不會看不懂吧
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:04:00
一個AI為了勝利 從單純的拚操作 自己學習到原來有"戰略"這樣的東西 並且實際表現出來 且逼近人類認同的想像這是非常美麗且厲害的事情
作者: qoo60606 (凜)   2019-01-25 21:06:00
內行看門道
作者: Jotarun (forever)   2019-01-25 21:06:00
我理解看了AlphaGo以後有些人希望AlphaStar一樣是智取但是系統學出來怎樣就是怎樣 他們並沒有直接去設定
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:07:00
miha的舉例我覺得可以 不過正因為星海的難度(或我們稱規則)複雜 所以當他能夠自學出人們想出的戰略時 比起棋類這種容易有最佳解的遊戲來說更讓人驚豔
作者: paul012011 (小全)   2019-01-25 21:09:00
問題在於 原本AI的APM設定理論上要在人類水準(以下)的結果這次比賽的裡已經飆到有點像悍馬2000了
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:10:00
舉個例子:以往的學習型AI(也是像人類的學習方式) 如果
作者: Jotarun (forever)   2019-01-25 21:10:00
他們並沒有特別設定APM
作者: paul012011 (小全)   2019-01-25 21:10:00
AI學習的前提是其他條件要和人類相仿啊
作者: Jotarun (forever)   2019-01-25 21:11:00
他就是從人學來的啊 人不也是平常某個APM 但偶而會飆起來
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:12:00
但deepmind不一樣 他的學習方式是:你給他一推設計圖 可
作者: kira925 (1 2 3 4 疾風炭)   2019-01-25 21:12:00
再說一次 人類飆上去的APM與AI飆上去的APM不等價
作者: Jotarun (forever)   2019-01-25 21:12:00
這以後他們應該會再看要怎麼處理
作者: miha80425 (ohsialay)   2019-01-25 21:13:00
就用卡爾達肖夫類似的說法 AI實現分三階段
作者: kira925 (1 2 3 4 疾風炭)   2019-01-25 21:13:00
我的意思就是 Deepmind一開始就設計錯規格了
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:13:00
子 這時他根本不知道什麼是好房子 但她在學習中發現房
作者: Jotarun (forever)   2019-01-25 21:14:00
我再講一次 沒有設計規格
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:14:00
子之間的差異 而且他能推納出有些是好的有些是壞的 最
作者: miha80425 (ohsialay)   2019-01-25 21:14:00
3.阿發X 特殊最佳解 也就是超越人類
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:15:00
後做出自己的房子
作者: lovinlover (Lovin Lover)   2019-01-25 21:15:00
小色現在在Olimo講解AlphaStar XD
作者: kira925 (1 2 3 4 疾風炭)   2019-01-25 21:16:00
他就是這裡錯誤好了嗎? 他沒有規範好邊界條件 把所有超過人類合理操作極限的所有模型幹掉做出來 對 很強 操作天下第一 但是收斂錯了
作者: miha80425 (ohsialay)   2019-01-25 21:16:00
人類文明無法實驗到最佳解 資源 金錢實在不夠用
作者: qoo60606 (凜)   2019-01-25 21:17:00
別這樣 圍棋也是超過人類合理思考極限阿 他就是做出超過人類水平的正常發揮嘛
作者: miha80425 (ohsialay)   2019-01-25 21:17:00
要阿發X算出好的方案 再進行實驗 這才是AI發展
作者: kira925 (1 2 3 4 疾風炭)   2019-01-25 21:17:00
星海爭霸是一個在設計上就透過引入操作性去設計單位交換
作者: Jotarun (forever)   2019-01-25 21:18:00
太早設限才不對 你根本不知道系統出來的結果是怎樣
作者: kira925 (1 2 3 4 疾風炭)   2019-01-25 21:18:00
的遊戲 忘記這一點講的天花亂墜根本沒有用
作者: miha80425 (ohsialay)   2019-01-25 21:19:00
放心啦 阿發星團隊也不會接受這樣的結果
作者: Jotarun (forever)   2019-01-25 21:20:00
如果只要APM就贏了那怎麼不見其他AI早早用這招?而且現在只是過程而已 一直抓著這點說人家錯很奇怪
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:22:00
就我所看到的是 阿法星在deepmind的學習行為下 發明了
作者: Jotarun (forever)   2019-01-25 21:22:00
實際上在訓練的過程之中 AlphaStar確實也展現了很多策略一開始只會rush 後來就會農 或者騷擾
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:23:00
營運 產兵 作戰 而作戰時要使用戰術 最後再加上大家詬
作者: qoo60606 (凜)   2019-01-25 21:23:00
你看FB團隊沒設APM還是打不贏阿(欸
作者: kira925 (1 2 3 4 疾風炭)   2019-01-25 21:26:00
你們根本沒認知到 在沒有合理規範收斂範圍下
作者: aCCQ (阿賢)   2019-01-25 21:26:00
討論的前題不一樣 一個是人機大戰公平性 一個是著重學習成果
作者: aCCQ (阿賢)   2019-01-25 21:27:00
你們討論是沒有結果的
作者: kira925 (1 2 3 4 疾風炭)   2019-01-25 21:27:00
對 學習成果很了不起 他是把之前沒人解決的模型做出來了但是他實際上解錯了東西好嗎這個遊戲的設計裡面就已經先隱藏預定了操作的限制
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:29:00
那是你以為他解錯了:他並沒有因為知道高APM能夠追獵能
作者: kira925 (1 2 3 4 疾風炭)   2019-01-25 21:29:00
單位的傷害輸出與血量裝甲云云都與這有牽連現在你扔一個超過設計規範的東西下去 那玩的就已經不同了
作者: kira925 (1 2 3 4 疾風炭)   2019-01-25 21:31:00
.........你以為人類真不知道操作完美的追獵可以贏不朽?
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:34:00
知道 但因為不會形成問題所以不會解決這個現象 如果是其他領域呢? 一個沒有人為定義或種族平衡的世界 他不能想出人類無法解決的問題的答案嗎?
作者: kira925 (1 2 3 4 疾風炭)   2019-01-25 21:37:00
所以我在說 你們想像的星海不是現實人類在打的星海
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:37:00
如果你是因為熱愛星海所以看出星海的缺陷 那你完全沒有問題但從這場比賽 同時也讓看到deepmind的未來
作者: Rex1009 (冬の影)   2019-01-25 21:38:00
你們講的就兩回事 完全沒有交集P大覺得我performance變好就能發paper了K大覺得我要買一個solution結果你給我一個我做不到的問題的定義不一樣
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:42:00
我會這樣解釋很簡單:因為deepmind不是為了成為星海第一而研發的 他是研發一個超級AI能夠解決問題包括星海如果為了解決單一問題而發展AI 就跟前一世代的AI沒什麼兩樣了就跟你沒辦法定義一個從小栽培數學且表現特好的孩子為數學天才 但你可以稱略懂基本知識而能解決延伸問題的為天才
作者: Rex1009 (冬の影)   2019-01-25 21:48:00
我相信Deepmind有野心要有一個強AI演算法但是AlphaStar的限制條件會被挑戰也很正常所以這個project這樣肯定是不型的
作者: Pegasus99 (天馬行空...的天馬)   2019-01-25 21:50:00
老闆大怒
作者: lovinlover (Lovin Lover)   2019-01-25 21:53:00
老仙剛剛說了 5:0MANA的系列戰是刻意不限制APM
作者: energyy1104 (Bill Wang)   2019-01-25 21:55:00
客服AI聽起來超廢 大家就是想對活生生的客服狂罵啊
作者: tsairay (火の紅寶石)   2019-01-25 23:40:00
這個再發展下去..AI控制的兵器很快就會出現了
作者: miha80425 (ohsialay)   2019-01-26 02:41:00
根據國外一些八卦 google離職員工說不想間接參與戰爭搞不好早就有了
作者: AMTS   2019-01-26 03:31:00
認真覺得純粹立場不同 AI開發者其實沒很在意輸贏只是想觀察他表現出來的模式 以現在來說算很有成果了
作者: angeltear15 (嘉明湖)   2019-01-26 10:26:00
事實上就是兩年算出 操作>>>>>all不是廢到笑是什麼?不就跟花幾百萬研究證明冰箱耗電比較大一樣
作者: Jotarun (forever)   2019-01-26 10:50:00
不懂裝懂還言之鑿鑿真可悲先把這個研究的目的搞懂吧
作者: eyesg (彌十郎)   2019-01-26 12:47:00
星海就屁孩遊戲 不需要啥智商越年輕手越快越有優勢
作者: angeltear15 (嘉明湖)   2019-01-26 13:46:00
麻煩那個所謂懂的人 快去把阿法Go 弄好 我再來推你不然其實也只是死魚在裝高潮 誰比較可悲? 哈
作者: Jotarun (forever)   2019-01-26 14:18:00
都2019了還在Go 先去念點書吧
作者: eyesg (彌十郎)   2019-01-26 14:27:00
這種AI強大在於它沒有壽命 你會死 我會死 怎麼學習都有歸零的一天 悍馬2000不會成長更是垃圾但是阿發系列 他們有精神時光屋 只要砸錢在硬體上可以達到非人的學習時間 星海普通玩家打十年 最多15000場 20000場但是他可以一秒數十盤而且他沒有壽命 雖然學習的速度跟人類比極慢慢 需要人類幫他調整方向增加效率...但是他永恆不死 目標又又由人類設定未來在軍事上 工程上 維護跟管理 將會大幅淘汰人類你覺得垃圾 只是代表你很無知
作者: arrenwu (鍵盤的戰鬼)   2019-01-26 14:32:00
那個前提是AI要能夠越來越強啊
作者: micbrimac (shark)   2019-01-27 06:29:00
無知的是讓AI練的下去 以後取代人類
作者: juicylove (juicy)   2019-01-27 09:56:00
就沒那麼容易做到啊 已經進步很多了

Links booklink

Contact Us: admin [ a t ] ucptt.com