Re: [情報] 機器之心報導DeepMind AlphaStar yoyoyin0119 PTT批踢踢實業坊

Re: [情報] 機器之心報導DeepMind AlphaStar

作者: yoyoyin0119 (UnSeenBlade) 2019-01-25 15:19:33

我覺得AlphaStar訓練得有點歪掉了欸……
大家想得到的訓練成果
應該是AI能夠像人類一樣
制定策略
預測對手行動
執行戰術並反制對手戰術
靈活的隨機應變能力
從這些層面來擊敗人類選手獲得勝利
結果這幾場看下來
AlphaStar練成的是戰術普普但是操作爆幹強
秀出人類根本做不到的微控來獲勝
但是這點在很久以前就有AI能做到了呀
何必訓練一個AlphaStar來做到一樣的事情
是不是因為為了訓練方便直接讓它讀取API，也沒特別限制手速
結果它找到最能獲勝的手段就是直接用控兵幹贏？
畢竟星海是設計給人來玩的
當初可不會設想到如果有手速是選手好幾倍的超人來玩
會把遊戲玩成什麼樣子……

作者: panruru1224 (boored) 2019-01-25 15:21:00

你要考慮在訓練過程AS(除了一開始的imitation以外)AS並不知道人類的玩法而是AS互打這表示這類型的

作者: mrmowmow (mow) 2019-01-25 15:22:00

因為你說的早就有的ai的基本戰略是人類key進去的，deepmind是自己學習這基本戰略

作者: panruru1224 (boored) 2019-01-25 15:22:00

戰術在雙方手速相當的時候還是很好的戰術

作者: arrenwu (鍵盤的戰鬼) 2019-01-25 15:26:00

我是覺得AS不是訓練來玩遊戲的啦先把AS訓練成「靠著神猛操作屌壓人類」這目標沒錯因為目前還做不到

作者: Jotarun (forever) 2019-01-25 15:36:00

你真要知道他怎麼控制先把這篇看完http://bit.ly/2WitmMy然後訓練成怎樣本來就是未知的

作者: homelife (SKY) 2019-01-25 15:53:00

昨天看完直播並不覺得每場都只靠控兵阿，真的誇張的不是只有360度追獵那場嗎? 另一場AI裂光球還誤炸自己好幾次

作者: martinmask (Michael) 2019-01-25 16:22:00

有沒有視頻連結

作者: azeroth (呆腦羊咩咩) 2019-01-25 16:24:00

VOD前面幾篇有

作者: z83420123 (VoLTsRiNe) 2019-01-25 16:25:00

誤炸自己好幾次那是第一週第一週操作看的出來沒訓練好會戰有點忙不過來但第二週那操作就不開玩笑了第一週那個大家更多還是吐槽tlo在打三小第二週被那操作看傻了

作者: jim8596 (休刊是童年的回憶) 2019-01-25 16:28:00

隱刀那場輸在操作好奇被大招電腦要怎麼解

作者: richard82010 (HatsuneMiku) 2019-01-25 16:52:00

或是AS經過百萬場對戰發現自己最強的方式就是提高所有單位的生存率，而最容易達成的方式就是驚人的微操.....利用自己絕對不會點歪的優勢

作者: Raikknen (Kimi) 2019-01-25 16:52:00

你不得不承認AI學習能力是飛快進步的

作者: hijacker (懶人一枚) 2019-01-25 16:54:00

他的微操也是靠學習來的啊

作者: penut85420 (PenutGGorz) 2019-01-25 17:10:00

因為贏得勝利的一方通常操作都很好

作者: toya123 (雷姆在我床上閉嘴) 2019-01-25 17:10:00

一定是韓國人帶壞阿法星的

作者: yeldnats (夜那) 2019-01-25 17:21:00

其實只是控兵很誇張奪走目光，看到360追獵就認為是靠微操，不過多面夾擊優勢雖然對人是常識，要AI自己學習出來卻是困難的

作者: willtaiwan (台灣能) 2019-01-25 17:29:00

很多亮點，他會分兵守先知，被菱鏡不朽弄到還是有應對，只是不是最佳應對

作者: miha80425 (ohsialay) 2019-01-25 17:37:00

說到底RTS是操作遊戲圍棋限時下子差多了極限大概就是防守應對以最低代價獲得優勢+高效操作碾想看到的AI戰略思維似乎是沒有

作者: nissptt (niss) 2019-01-25 17:41:00

樓主要說的是"戰略普普"吧?對應戰爭。?縮小一級才是戰術，對應戰役。操作又更小一級, 對應哪個詞彙我不清楚。至於跨小分，不同局的應對，AI應該不如真人。

作者: angeltear15 (嘉明湖) 2019-01-25 17:41:00

花兩年弄出悍馬2000 真的廢到笑

作者: ohmylove347 (ç±³ç‰¹å·´çˆ¾) 2019-01-25 17:45:00

已經很強了，這個進步是大家難以想像的快，我們幾代的超猛AI就快來了不用擔心

作者: miha80425 (ohsialay) 2019-01-25 17:47:00

媽的大失業時代真的要來了XD

作者: Jotarun (forever) 2019-01-25 17:48:00

廢到笑的是不懂內涵覺得這個廢的人吧 LUL

作者: miha80425 (ohsialay) 2019-01-25 17:54:00

現在商用AI可以從只回答一個問題到分辨不同問題回答再進化一點客服人員真的沒飯吃

作者: TFsonG 2019-01-25 17:55:00

還有很長一段路要走

作者: peanutman (偷~~島~~林) 2019-01-25 18:11:00

想看AI打Has XD

作者: Jotarun (forever) 2019-01-25 18:15:00

客服AI 喔那個真的是廢到笑

作者: qoo60606 (凜) 2019-01-25 18:18:00

演算法不知道用哪些很有趣

作者: Jotarun (forever) 2019-01-25 18:23:00

主要的演算法DeepMindblog有寫可以找我的兩篇文都有連結

作者: hikerLin (自慢) 2019-01-25 18:28:00

AI被針對弱點之後怎麼自動學習改進才是想看的

作者: qoo60606 (凜) 2019-01-25 18:48:00

只看得懂是深度神經網路其他不懂了qq

作者: tasin (Ringo) 2019-01-25 18:52:00

操作學習上我也覺得佔得太多導致ai的配兵從tlo的版本到mana的版本反而越來越單純雖然她會拉陣包夾真的很屌

作者: WindSpread (陽だまりの詩) 2019-01-25 18:54:00

AS:SIMPLE IS BEST (blinkblinkblink

作者: zephyr (斷了線的風箏) 2019-01-25 18:57:00

應該可以透過參數調整再訓練現在的條件好的解是靠操作但重點是七天練兩百年的流程已經建立起來了訓練條件不同可能就會生出其他的最佳解

作者: qoo60606 (凜) 2019-01-25 19:01:00

https://www.youtube.com/watch?v=5iZlrBqDYPM

作者: LochtsStorM (Lochts) 2019-01-25 19:39:00

打的目的就是要順便看看大家的想法說廢到笑的還滿可憐的

作者: catmeat777 (多蘿喵) 2019-01-25 19:52:00

說廢的連AI都打不贏，不意外

作者: confucamus 2019-01-25 19:59:00

操作也是建立在營運沒有問題的情況下好嗎，不然找個可以這樣營運的的來看看，悍馬2000有做到這個嗎?

作者: APM99 (血統純正台北人) 2019-01-25 19:59:00

兩年前就說過DeepMind 選錯遊戲了星海2是操作為主的遊戲DeepMind 當初就該去選沒有'a'的即時戰略遊戲可是不少阿只是那些遊戲都沒玩家了^^Maru或Serral 依靠的都是操作取勝論策略預測執行靈活這篇推文抽十個說不定都能有五個比這兩位頂尖選手強

作者: fragmentwing (片翼碎夢) 2019-01-25 20:28:00

覺得戰術搭配到敵我手速差別也不是不行不過這得有個度故意讓對方要用高手速來互拼的當然可以但是不是靠手速萬解打法serral、maru也算很會變換戰術和心理戰的選手了

作者: z83420123 (VoLTsRiNe) 2019-01-25 20:38:00

這篇推文論策略預測執行靈活我可以說一個都不會有比他們強

作者: fragmentwing (片翼碎夢) 2019-01-25 20:39:00

八卦是剛剛看到TLO手速也飆到1350過w

作者: Jotarun (forever) 2019-01-25 20:39:00

光沒玩家這件事就不行啊這已經是賠錢生意連知名度都沒

作者: kira925 (1 2 3 4 疾風炭) 2019-01-25 20:39:00

阿那個就刷出來的東西不一樣的

作者: Jotarun (forever) 2019-01-25 20:40:00

還搞啥而且操作也是要學習的又不是亂按按的快就行看之前其他AI打起來都什麼鬼樣子就可以知道這個問題的難度人家看上的也是難度話說Facebook上次圍棋輸這次SC2也是暫時落後蠻多的不知道Lecun私底下會不會發飆XD

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 20:51:00

如果每個人都知道DeepMind是什麼意思就不會有人以為AI是靠手速贏的

作者: kira925 (1 2 3 4 疾風炭) 2019-01-25 20:51:00

FB好像是去玩星海一的AI 不過....第一名也沒拿到XD不 AI昨天確實就是用手速贏的他的戰略很明確因為有可靠的高手速所以他的戰略就是純粹堆追獵然後拼操作強壓當然這個跟簡化成"AI只是會操作"有點微妙的不同但是要說這個不是靠手速...他是靠手速阿

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 20:54:00

那就是你只知道表面了很高興你自告奮勇的解釋

作者: APM99 (血統純正台北人) 2019-01-25 20:54:00

這跟表面無關這跟遊戲本質有關這遊戲本來就是靠操作

作者: kira925 (1 2 3 4 疾風炭) 2019-01-25 20:55:00

我想這邊已經辯論過兩輪到底怎樣了半途跳出來喊你們不懂呵呵呵

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 20:56:00

DeepMind一定要選星海這種複雜度夠高的RTS 才能代表他真的有學到東西所謂的DeepMind就是為了跟一般的學習型AI做區分:如果開發團隊有照著定義的話 DeepMind是指人類從來沒有教他要做什麼甚至不應該給他棋譜/RP 而是單純讓他學習星海是什麼樣的遊戲告訴她操作方法後讓他自己去跑也就是

作者: kira925 (1 2 3 4 疾風炭) 2019-01-25 20:59:00

好現在我們明確知道是誰只知道表面了

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:00:00

說DeepMind是在不知道大家怎麼玩星海的前提下去打到現

作者: paul012011 (小全) 2019-01-25 21:00:00

k大前面的意思是因為手速設定的問題理論上應該要鑽研戰略的AI一頭鑽進去生基本兵後瘋狂微操

作者: KTZest (P7GAB) 2019-01-25 21:01:00

這個AI打得贏韓國頂尖神族嗎？

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:02:00

人類想像的戰略這樣不能否定從無到有的這種驚人的自學成果

作者: miha80425 (ohsialay) 2019-01-25 21:03:00

AI沒有聰明到會證1+1 他會找最簡單的方式解決但是人類想讓AI變到會證1+1 而不是直接給2這個答案用這例子解釋不會看不懂吧

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:04:00

一個AI為了勝利從單純的拚操作自己學習到原來有"戰略"這樣的東西並且實際表現出來且逼近人類認同的想像這是非常美麗且厲害的事情

作者: qoo60606 (凜) 2019-01-25 21:06:00

內行看門道

作者: Jotarun (forever) 2019-01-25 21:06:00

我理解看了AlphaGo以後有些人希望AlphaStar一樣是智取但是系統學出來怎樣就是怎樣他們並沒有直接去設定

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:07:00

miha的舉例我覺得可以不過正因為星海的難度(或我們稱規則)複雜所以當他能夠自學出人們想出的戰略時比起棋類這種容易有最佳解的遊戲來說更讓人驚豔

作者: paul012011 (小全) 2019-01-25 21:09:00

問題在於原本AI的APM設定理論上要在人類水準(以下)的結果這次比賽的裡已經飆到有點像悍馬2000了

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:10:00

舉個例子:以往的學習型AI(也是像人類的學習方式) 如果

作者: Jotarun (forever) 2019-01-25 21:10:00

他們並沒有特別設定APM

作者: paul012011 (小全) 2019-01-25 21:10:00

AI學習的前提是其他條件要和人類相仿啊

作者: Jotarun (forever) 2019-01-25 21:11:00

他就是從人學來的啊人不也是平常某個APM 但偶而會飆起來

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:12:00

但deepmind不一樣他的學習方式是:你給他一推設計圖可

作者: kira925 (1 2 3 4 疾風炭) 2019-01-25 21:12:00

再說一次人類飆上去的APM與AI飆上去的APM不等價

作者: Jotarun (forever) 2019-01-25 21:12:00

這以後他們應該會再看要怎麼處理

作者: miha80425 (ohsialay) 2019-01-25 21:13:00

就用卡爾達肖夫類似的說法 AI實現分三階段

作者: kira925 (1 2 3 4 疾風炭) 2019-01-25 21:13:00

我的意思就是 Deepmind一開始就設計錯規格了

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:13:00

子這時他根本不知道什麼是好房子但她在學習中發現房

作者: Jotarun (forever) 2019-01-25 21:14:00

我再講一次沒有設計規格

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:14:00

子之間的差異而且他能推納出有些是好的有些是壞的最

作者: miha80425 (ohsialay) 2019-01-25 21:14:00

3.阿發X 特殊最佳解也就是超越人類

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:15:00

後做出自己的房子

作者: lovinlover (Lovin Lover) 2019-01-25 21:15:00

小色現在在Olimo講解AlphaStar XD

作者: kira925 (1 2 3 4 疾風炭) 2019-01-25 21:16:00

他就是這裡錯誤好了嗎? 他沒有規範好邊界條件把所有超過人類合理操作極限的所有模型幹掉做出來對很強操作天下第一但是收斂錯了

作者: miha80425 (ohsialay) 2019-01-25 21:16:00

人類文明無法實驗到最佳解資源金錢實在不夠用

作者: qoo60606 (凜) 2019-01-25 21:17:00

別這樣圍棋也是超過人類合理思考極限阿他就是做出超過人類水平的正常發揮嘛

作者: miha80425 (ohsialay) 2019-01-25 21:17:00

要阿發X算出好的方案再進行實驗這才是AI發展

作者: kira925 (1 2 3 4 疾風炭) 2019-01-25 21:17:00

星海爭霸是一個在設計上就透過引入操作性去設計單位交換

作者: Jotarun (forever) 2019-01-25 21:18:00

太早設限才不對你根本不知道系統出來的結果是怎樣

作者: kira925 (1 2 3 4 疾風炭) 2019-01-25 21:18:00

的遊戲忘記這一點講的天花亂墜根本沒有用

作者: miha80425 (ohsialay) 2019-01-25 21:19:00

放心啦阿發星團隊也不會接受這樣的結果

作者: Jotarun (forever) 2019-01-25 21:20:00

如果只要APM就贏了那怎麼不見其他AI早早用這招?而且現在只是過程而已一直抓著這點說人家錯很奇怪

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:22:00

就我所看到的是阿法星在deepmind的學習行為下發明了

作者: Jotarun (forever) 2019-01-25 21:22:00

實際上在訓練的過程之中 AlphaStar確實也展現了很多策略一開始只會rush 後來就會農或者騷擾

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:23:00

營運產兵作戰而作戰時要使用戰術最後再加上大家詬

作者: qoo60606 (凜) 2019-01-25 21:23:00

你看FB團隊沒設APM還是打不贏阿(欸

作者: kira925 (1 2 3 4 疾風炭) 2019-01-25 21:26:00

你們根本沒認知到在沒有合理規範收斂範圍下

作者: aCCQ (阿賢) 2019-01-25 21:26:00

討論的前題不一樣一個是人機大戰公平性一個是著重學習成果

作者: aCCQ (阿賢) 2019-01-25 21:27:00

你們討論是沒有結果的

作者: kira925 (1 2 3 4 疾風炭) 2019-01-25 21:27:00

對學習成果很了不起他是把之前沒人解決的模型做出來了但是他實際上解錯了東西好嗎這個遊戲的設計裡面就已經先隱藏預定了操作的限制

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:29:00

那是你以為他解錯了:他並沒有因為知道高APM能夠追獵能

作者: kira925 (1 2 3 4 疾風炭) 2019-01-25 21:29:00

單位的傷害輸出與血量裝甲云云都與這有牽連現在你扔一個超過設計規範的東西下去那玩的就已經不同了

作者: kira925 (1 2 3 4 疾風炭) 2019-01-25 21:31:00

.........你以為人類真不知道操作完美的追獵可以贏不朽?

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:34:00

知道但因為不會形成問題所以不會解決這個現象如果是其他領域呢? 一個沒有人為定義或種族平衡的世界他不能想出人類無法解決的問題的答案嗎?

作者: kira925 (1 2 3 4 疾風炭) 2019-01-25 21:37:00

所以我在說你們想像的星海不是現實人類在打的星海

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:37:00

如果你是因為熱愛星海所以看出星海的缺陷那你完全沒有問題但從這場比賽同時也讓看到deepmind的未來

作者: Rex1009 (冬の影) 2019-01-25 21:38:00

你們講的就兩回事完全沒有交集P大覺得我performance變好就能發paper了K大覺得我要買一個solution結果你給我一個我做不到的問題的定義不一樣

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:42:00

我會這樣解釋很簡單:因為deepmind不是為了成為星海第一而研發的他是研發一個超級AI能夠解決問題包括星海如果為了解決單一問題而發展AI 就跟前一世代的AI沒什麼兩樣了就跟你沒辦法定義一個從小栽培數學且表現特好的孩子為數學天才但你可以稱略懂基本知識而能解決延伸問題的為天才

作者: Rex1009 (冬の影) 2019-01-25 21:48:00

我相信Deepmind有野心要有一個強AI演算法但是AlphaStar的限制條件會被挑戰也很正常所以這個project這樣肯定是不型的

作者: Pegasus99 (天馬行空...的天馬) 2019-01-25 21:50:00

老闆大怒

作者: lovinlover (Lovin Lover) 2019-01-25 21:53:00

老仙剛剛說了 5:0MANA的系列戰是刻意不限制APM

作者: energyy1104 (Bill Wang) 2019-01-25 21:55:00

客服AI聽起來超廢大家就是想對活生生的客服狂罵啊

作者: tsairay (火の紅寶石) 2019-01-25 23:40:00

這個再發展下去..AI控制的兵器很快就會出現了

作者: miha80425 (ohsialay) 2019-01-26 02:41:00

根據國外一些八卦 google離職員工說不想間接參與戰爭搞不好早就有了

作者: AMTS 2019-01-26 03:31:00

認真覺得純粹立場不同 AI開發者其實沒很在意輸贏只是想觀察他表現出來的模式以現在來說算很有成果了

作者: angeltear15 (嘉明湖) 2019-01-26 10:26:00

事實上就是兩年算出操作>>>>>all不是廢到笑是什麼？不就跟花幾百萬研究證明冰箱耗電比較大一樣

作者: Jotarun (forever) 2019-01-26 10:50:00

不懂裝懂還言之鑿鑿真可悲先把這個研究的目的搞懂吧

作者: eyesg (å½ŒåéƒŽ) 2019-01-26 12:47:00

星海就屁孩遊戲不需要啥智商越年輕手越快越有優勢

作者: angeltear15 (嘉明湖) 2019-01-26 13:46:00

麻煩那個所謂懂的人快去把阿法Go 弄好我再來推你不然其實也只是死魚在裝高潮誰比較可悲? 哈

作者: Jotarun (forever) 2019-01-26 14:18:00

都2019了還在Go 先去念點書吧

作者: eyesg (å½ŒåéƒŽ) 2019-01-26 14:27:00

這種AI強大在於它沒有壽命你會死我會死怎麼學習都有歸零的一天悍馬2000不會成長更是垃圾但是阿發系列他們有精神時光屋只要砸錢在硬體上可以達到非人的學習時間星海普通玩家打十年最多15000場 20000場但是他可以一秒數十盤而且他沒有壽命雖然學習的速度跟人類比極慢慢需要人類幫他調整方向增加效率...但是他永恆不死目標又又由人類設定未來在軍事上工程上維護跟管理將會大幅淘汰人類你覺得垃圾只是代表你很無知

作者: arrenwu (鍵盤的戰鬼) 2019-01-26 14:32:00

那個前提是AI要能夠越來越強啊

作者: micbrimac (shark) 2019-01-27 06:29:00

無知的是讓AI練的下去以後取代人類

作者: juicylove (juicy) 2019-01-27 09:56:00

就沒那麼容易做到啊已經進步很多了

繼續閱讀

[情報] 機器之心報導DeepMind AlphaStarJotarun [問題] 關於凱姊跟諾娃的強度papertim [情報] GSL改制？WCS跟GSL只能擇一參加？capssan [問題] 澤拉圖合作bugallencyh [聯賽] FRIEND SHIP #2 - Has vs. Leenock BO11AzureRush [實況] byun 音樂台barry00561 [情報] DeepMind AlphaStar星海示範賽Jotarun [情報] 熾熱青春(BZS:May) 月底回歸AzureRush [買賣] 星海爭霸2三部曲典藏版實體包Valvetronic [情報] 本週異變：極限超頻fragmentwing