[問題] AlphaZero如果突然給它20x20的棋盤 dharma PTT批踢踢實業坊

[問題] AlphaZero如果突然給它20x20的棋盤

作者: dharma (é”) 2019-06-15 14:32:45

這個演示非常令人驚訝，但哈薩比斯還是有所保留。如果虛擬平板略微往上移動一點點，
程式就會失敗。DeepMind程式所學到的技能是如此受限制－－它甚至無法對環境的微小變
化（比人類走路時對環境產生的微小影響還小）作出反應－－至少在沒有數千輪強化學習
的情況下既是如此。但是現實世界已經內置了這樣的應對系統。
https://tinyurl.com/yydt55tn
Deepmind老大說
即使是已經訓練好的「打磚塊」遊戲AI
只要遊戲設定做個微小的調整
AI就會失敗
需要再更多的訓練，才能因應新的狀況
圍棋「人類」棋手如果突然面對20x20的棋盤
可能對棋力沒什麼影響
那麼如果突然讓目前最強圍棋AI「AlphaZero」和人類下20x20
AI可能會表現的如何？
thanks

作者: maplefoxs (狐狸怎麼叫) 2019-06-15 15:08:00

前幾盤可能可以贏吧我覺得這個議題蠻好的值得一試

作者: HeterCompute (異質運算) 2019-06-15 16:28:00

如果什麼都不動，alphago不能下20路圍棋，因為連輸入只能是19路棋盤，但是如果經過一些技巧訓練個1天，贏過人類還是綽綽有餘

作者: kria5304 (XenoMegaREENovaSaga) 2019-06-15 16:48:00

應該要重新train吧但只要input維度改一下其他架構大概可以沿用感覺是這樣

作者: q6261901 (皮笑了那肉呢) 2019-06-15 21:01:00

之前用leela跑19路之外，全部都當成19路在下

作者: forb9823018 (風過無痕) 2019-06-15 22:54:00

有影響但不會到非常劇烈對人類而言

作者: AmibaGelos (Amiba Gelos) 2019-06-15 23:16:00

主要是cnn對邊緣太敏感提供座標給cnn能部分解決問題圍棋的話多輸入盤面大小應該任意盤面都能共用網路吧

作者: ddavid (謊言接線生) 2019-06-16 00:27:00

其實了解深度學習的話就知道這沒什麼好驚訝的啊XD@AmibaGelos 把棋盤大小也都當參數當然也不是不行，但這樣實質上等價於每種大小的棋盤分別訓練，甚至未必比較好你如果想要用這種方式把20x20也同時訓練起來，造成的結果就是所花的時間（或訓練到一定棋力所需局數）就是19x19所需 + 20x20所需，至少以現有架構而言它沒有學習不同盤面大小共通知識的能力。未來技術再發展也許慢慢會往這邊前進，人類舉一反三的能力一直都是共通型AI的長遠目標

作者: AmibaGelos (Amiba Gelos) 2019-06-16 17:35:00

不一定吧如果有無關盤面大小的準則的話大小就標定邊緣而已類似標定黑白策略確實不同但不是不會重疊

作者: enjoytbook (en) 2019-06-17 10:10:00

人家AI就跟人類不一樣啊

作者: ddavid (謊言接線生) 2019-06-17 17:47:00

AI目前這種學習方式就是學不到那樣的通則現在是貼目數不同都會無法完全通用的狀態，AI學不到那種「我把現在當作落後所以攻兇一點就搞定了」的轉換性概念。當然有一組AI的目標設定為就算領先也會盡可能繼續取得目數而不要退守，那個設定就相對能應付貼目改變問題，但付出的代價就會是潛在的安定性。至於盤面大小，現況是不同盤面肯定要重新訓練的情況，不然別說複雜細算了，征子算錯的情況都有可能發生。在19路棋盤訓練出來的模組採用一個征子有利的下法，到了20路變成征子不利，深度學習選取棋步時可能並不會發現這個問題這點反而是傳統搜尋式AI有機會搜尋下去發現問題，搜尋層數足夠的話。

作者: AmibaGelos (Amiba Gelos) 2019-06-18 00:41:00

也許吧有空設計個網路混合訓練6*6~9*9 應該很有趣xd

作者: staristic (ANSI lover) 2019-06-18 00:50:00

說到征子，以現在的架構，盤面越大征子好像要練訓越久?理論上好像越大的棋盤人類越有機會用征子套爆AI

作者: ddavid (謊言接線生) 2019-06-18 17:59:00

應該說本來手數多的套路如大型定石、長時間劫爭這些本來就是要訓練更多局才會有機率覆蓋到完整最佳著手征子本來可以視為一個很長的套路，然而征子是一個人類能夠用共通概念推理快速簡化計算的特例，圍棋AI沒有這種簡化概念，需要真的實際算過所以盤面越大當然就大幅增加訓練時間。一方面要模擬完一局需要更久，而獲取足夠資訊所需的訓練對局數也大幅增加@AmibaGelos 混合訓練不同大小目前事實上就是無意義啦。對AI問題是全等於分開訓練，而且反而有可能因為對於盤面大小這個參數的模糊化導致模型品質的下降

作者: jojoStar (ç™½é‡‘ä¹‹æ˜Ÿ) 2019-09-13 01:54:00

以人類觀點來說這不就叫做不知變通嗎XD

繼續閱讀

[棋訊] 台灣旅日棋士賽事小整理(2019/06/15)MisatoMitumi [Live] 第74期本因坊戰第4局井山裕太:河野臨zeat [心得] 京都龍源院 - 如果能和德川家康來一盤b1233967 [棋訊] 第9屆黃龍士．精鍛科技杯第2階段zeat [Live] 第74期本因坊戰第3局井山裕太:河野臨zeat [棋訊] 柯潔正式獲得清華錄取將成古力江維杰學Sherry [棋訊] 三星盃賽制大改革本賽僅8天決出冠軍Sherry [棋訊] 第24期LG盃16強賽新聞整理Sherry [棋訊] [MLILY夢百合杯] 仲邑堇外卡出戰(附圖)Sherry [棋訊] 龍星戰半決賽江維傑勝辜梓豪將與許嘉陽Sherry