Re: [閒聊] 黃士傑博士:AlphaZero團隊登上Science

作者: para123 (好心情,事才會做好)   2018-12-13 07:13:53
圍棋、星海、卡牌遊戲,以及電腦AI什麼的,
這些項目雖然小弟全部都是菜逼,但都略有涉及,聊到這個就很多看法想分享一下:
用人工智能來進行競賽遊戲,我想無非就是看成績單說話吧,
就像圍棋,電腦一堆下法,若是在alphago還沒問世前,經由人手下出來,那麼
肯定不是被人笑就是被老師罵,
偏偏咱們的alphago老師最後都用成績說話,也不跟你嘴,
人類也才終於開始願意檢討自己,檢討一堆人類(圍棋)世界的鐵則,
重點就是:成績。
而人工智能,小弟沒讀書,用句直白話說吧,
[純手工打造AI] v.s. [自學型AI],似乎又是兩碼子事,
就拿圍棋來說吧,被人類價值觀影響與否的圍棋AI,表現出來的水準就是兩個檔次,
甚至過往那些不依靠自學的純手工圍棋AI,棋力怎麼樣我就不好意思說了大家都很清楚。
看待事情的面相很多,但我想就先用最現實的 "成績" 來說吧,
如果要用人類跟AI來做比較,我認為在卡牌遊戲上,AI的成績肯定比較差,
但絕對不是因為卡牌遊戲難掌握,
對電腦來說,這些卡牌遊戲的計算,實在是簡單到爆,
就是單純的數學遊戲罷了,
常常我們覺得 "複雜" 、覺得 "變化多" ,在電腦眼裡都是1秒鐘的事,
看著自己滿手牌+場上敵我一堆牌,你是不是覺得傷透腦筋覺得好多變化阿,
好難決定要先出哪張,好難決定出牌次序啊,
但那是對人來說啊,
電腦就算用土法煉鋼也是1秒鐘的事,
那些我們覺得複雜的感覺,常常都只是一種能力不足而導致的錯覺。
一款卡牌遊戲就算設計了100萬種卡片,
但在對戰的過程中,每個當下其實也就是你看得到的那幾張牌,
對於其他看不到的部分的猜測與推想都是沒意義的,
也可以說是有意義啦,
因為運氣這種東西,本來就是左右著卡牌遊戲的最大關鍵,
對,就是最大,
這也就是為什麼我會說在卡牌遊戲中,比起星海或圍棋,人類勝率反而會高的原因。
比較值得關注與討論的議題應該是這些即時戰略的遊戲吧,
我認為,前面所說 "手工型" vs "自學型" ,可能會有很大的出入,
至少在初期是吧,
即時戰略的東西,分秒瞬息萬變,
要讓電腦從當中自我學習並慢慢理出邏輯,理出所謂的真理、並學習,覺得需要
花費不少的時間,
其實關於星海的 "學習型AI" ,確實有網站24小時在轉播電腦自己跟自己PK的實況,
目前都還是玩得非常爆笑,而且常常很容易出現單位在原地左右高速抖動的畫面,
要讓電腦 "學" 到足以打敗人類,我認為還需要花非常大的資源。
但如果是 "手工型" 呢?我認為電腦很快就可以打敗人類了,
我們所謂很多的 "戰術" ,都會有時間軸,
什麼樣的進攻,最快大概是幾分幾秒會完成、會抵達,
這個戰術的幾分幾秒會有空窗期,
這張地圖從A點走到B點要多少時間,
這些東西不用說是電腦,光人腦都已經掌握得很好了,
所以戰術上的鬥智,如果能藉由人類 "手工" 來輔助,電腦很快就能掌握得差不多,

有一個部分,電腦有著無比巨大的優勢,
那就是APM的部分,(以下少部分內容適合遊戲玩家)
所有的 "戰術" ,所有對戰場上的理解與判斷,都必須建立在
對自己的 "兵" 的了解,
不是只有遊戲,真正的戰爭,甚至職場商場上都一樣,
同樣是派 "一個人" 去做一件事,但派A去跟派B去就是兩回事,
回頭說說即時戰略吧,
看起來,大家都用一樣的兵,
你有10隻機槍兵,我有8隻機槍兵,
長得一模一樣,看起來就是10隻會打贏,
但是如果10隻在我手上,8隻在電腦手上,
那我就覺得幹我輸定了,
因為電腦手上的機槍兵每隻都是張飛啊!
當今星海的職業賽何不是如此呢?
同樣的戰術同樣的場合,
A玩家拿來對付B玩家是正確的戰術,但A玩家拿來對C玩家用就是錯誤的戰術!
即時戰略的APM往往跟勝敗成正比,
偶有智商壓制或失誤就另當別論,
用個星海爭霸二的內容舉個例子吧,
你可以用1隻追獵者打贏1隻狂戰士,因為有操作空間,
但是如果同時間有8個地方都在 1追獵vs1狂戰 呢?
你如果有3000apm我想肯定是沒問題,8處都贏,
但如果只有300apm甚至更低呢?
所以apm不同的世界,很多觀念與理解可能都會顛覆,
即使不懂電玩,那就想想那alphago,
是不是用那超乎常人的計算力,顛覆了我們對圍棋的理解呢?
話講了一堆,簡單說個結論吧,只是我個人的看法:
論成績,人類 vs 電腦,
卡牌遊戲,AI能輕鬆掌握,但成績未必理想。
星海爭霸,自學型AI必須花不少的資源學習,未來肯定超過手工型;
而手工型,可以在很短的時間內大勝人類。
而圍棋嘛,成績已經攤在眼前了 xD
題外話,
好期待有一天會出現並推廣[球型棋盤],
想像兩個人在地球儀上面下棋就對了,
希望有一天,能看到頂尖圍棋AI在球型棋盤上下棋,
再由幽默風趣的棋士一邊轉動著地球儀一邊轉播戰況~
作者: BBSealion (海獅)   2018-12-13 10:16:00
APM 我認為會限制的,要挑戰這題目就是想挑戰智能極限而不是拿電腦本來就有的優勢來壓制人類,這樣就失去意義,頂多搏一波新聞,但DeepMind想做的絕對是從根本上的智能去贏過人類,這樣才有發下一篇Science的價值
作者: buji (卜基)   2018-12-13 12:01:00
地球棋盤很有意思
作者: hit0123 (@@")   2018-12-13 12:11:00
apm老早說會刻意壓到跟人接近
作者: indium111 (#ttyhg)   2018-12-13 13:54:00
即使跟人類相同的apm,電腦在計算上遠超人類比如一隻大和艦面對一群機槍兵該在第幾秒撤退,人類算不出來,但電腦可掉很精細的神操作境界但如果要從0開始學起,星海這個大棋盤可比圍棋複雜多了
作者: deerdriver (騎鹿人)   2018-12-13 16:46:00
說不定只是演算法不合啊
作者: ilw4e (可以吃嗎?)   2018-12-13 22:46:00
APM設限電腦也一定會優化成最有效的動作
作者: ddavid (謊言接線生)   2018-12-14 02:21:00
就說APM會限制了還在APM輾壓XD然後這篇對難度的分析不能說完全錯,但是忽略很重要的一點在於卡牌跟星海都是屬於不完全資訊遊戲,這類遊戲在根本難度就是比起完全資訊遊戲高,主要在於自我學習的不確定性圍棋這種東西是有絕對正確解答的,一路下下去,到最後就是每一手的資訊都很清楚可以完全重現卡牌、星海就不一樣了,你在場上遇到完全同樣的局面,事實上看不到的東西可能天差地遠,這就增加了學習上的困難至於卡牌靠不靠賽,其實還是要看是哪一種卡牌,不同遊戲其實靠賽程度差距很大。而且卡牌遊戲本來就是一種「玩家盡可能打到最好,剩下才交給機率」的一類遊戲(如同麻將、橋牌),頂級的玩家長久下來勝率肯定是比一般玩家高的,只是不同的卡牌遊戲會決定這個高低差距遠不遠,越靠賽的差距越小,技術成分越重的差距越大。而且別忘了卡牌遊戲還有組套牌這個環節,光是賽場預測跟套牌選擇、對應等等上場之前的準備就能讓高端職業玩家跟一般玩家的勝率拉開不少。雖然AI研究應該還玩不到這個地步就是XD另外上面提到星海AI可以極度優化操作這部分,上一篇推文已經說過了,早就有利用舊式AI概念做出來的完美操作AI。但之所以說是舊式AI,就因為那是由人類直接告訴AI怎麼操作最好,然後由AI去計算做到最完美所以達成的。從深度學習來做就徹底不是這麼一回事了。深度學習AI光是要自學出怎麼操作叫做好這回事就很困難,更不用說前提是還得懂得生產兵種出來。你想做出完美的Marine海無損打爆炸蟲群,前提也要是AI能學到正確的時間點會出到足量的Marine研發好打針而且還能正確派到認為毒爆蟲會來的地方。對人類看起來並不會很難理解的一套體系,深度學習要從頭學下來可沒那麼容易──因為人腦學習這些東西其實也比你想像中困難許多,只是人腦規格夠高且本來就相對擅長這種不完全資訊下的推理。
作者: alisha2224 (霂楠)   2018-12-14 10:02:00
apm會限制,但會失誤跟不會,還是有巨大差距的
作者: butten986 (白色的惡魔)   2018-12-15 11:16:00
如果真的能在限制apm的情況下摸出戰術,拿到現實也行
作者: ddavid (謊言接線生)   2018-12-16 02:13:00
@alisha2224 你說的沒錯,但問題就是在星海這個劇本下,深度學習要學到怎樣的操作是不是失誤難度蠻高的之前一直提到的,他們連好好採礦開局都還學不起來,就是因為怎麼樣的操作算是好這件事要自然由深度學習自己學到並不容易
作者: capita (小明)   2018-12-17 02:23:00
實務上球形棋盤是橫向循環並不理想 所以很難推廣上下左右都無邊的循環棋盤 在拓撲結構上其實是環狀的棋盤
作者: Minesweeper (lleh)   2018-12-18 02:07:00
https://arxiv.org/abs/1708.04782去年星海AI的進度,我看是很慘啦
作者: clarkyoona (clarkyoonazang)   2017-02-13 11:52:00
好好笑喔這篇

Links booklink

Contact Us: admin [ a t ] ucptt.com