[討論] 或許類似征子的大型單行道棋形才是弱點

作者: Django (Cython)   2016-03-14 21:02:53
這幾天看來看去似乎最多篇文章都是想要針對打劫來突破
不過很少人討論征子...我個人覺得這可能是一個突破點
(其實我覺得#1MveEG8q 這篇內文和推文有些跟我想法就有點相似...)
為什麼會覺得征子是一個突破點呢
因為他是一個手數很長的單行道
以前AI用的Alpha-Beta系列演算法和現在的MCTS演算法
如果沒有特別去補這塊 可能都會碰到難題
Alpha-Beta系列其實本質上是窮舉 征子征到棋盤對面要二三十手
要窮舉這麼多手不太可能 只能窮舉到一半
然後用審局函數(類似形勢判斷的意思)判定現在盤面
但是沒有特別給電腦征子的知識的話 這個下到一半的征子恐怕電腦是看不懂誰死誰活的..
至於MCTS為什麼會有問題呢
就如上面說的 他是一個手數很長的單行道
假設我(電腦)是白方 黑方一直跑 我每一手都只有一個著點可以繼續征(沒引征點的話)
中間只要我一手下錯 黑方就跑掉了
反過來說也是 只要被征方一手沒跑 就馬上被吃了
而MCTS是靠(大量)隨機下子模擬棋局的話
相對於根本沒有標準答案的序盤
可能有不同手筋/不同轉換餘地/局部手順沒這麼長的中盤
征子你要電腦連續隨機下30手都下在"標準答案"的地方是很困難的
或者可以說 我隨機模擬一盤 剛好模擬到這個正確結果的機率小到趨近於0
就算模擬到了那樣本數也微不足道
當然還有一招是從職棋的譜中自然習得
但是職棋的譜又不可能真的把征子征到棋盤底死給你看
電腦怎麼知道被征掉的那方不跑是因為會跑到最後被吃掉?
怎麼知道征掉別人的那方不提掉是因為對方不可能跑得掉?
所以說征子的確是大有可能需要特別寫規則去照顧的..
當然我們是希望這種人類的"特別干涉"越少越好
我們不會特別去教電腦下什麼定石什麼手筋
這樣case by case的去教不但根本教不完而且可能根本反效果
但至少初階的程式不特別照顧征子的話一定會爆炸
這種特別餵給電腦的知識叫domain knowledge
其實靠隨機模擬的MCTS一開始可能就需要一些基本的domain knowledge 不然會很恐怖
例如至少要教他有兩個眼的大龍不可以去自填
不然一方下到形勢大好結果把單官填完開始填自己眼位自殺..這樣模擬的結果根本沒意義
(而且這樣電腦怎麼知道什麼時候一盤棋是下完了???)
嗯...回到一開始說的目的 當然我相信AlphaGo一定有做好面對基本征子的準備
(連我都知道征子是個常見的困擾 他們怎可能不知道...)
補強這塊的演算法可能也比初階的程式採取的方案更完備
不過如果變得更複雜
例如帶有征子的攻殺
或是引征又複合其他手筋的情況
或許alphago會產生很大的困擾
當然其他手數長的(對人類而言的)單行道 我也覺得都可以試試
征子對電腦的難題總歸一句就是 有手數長的唯一解 但是人類解答非常輕鬆 電腦很困難
所以才要特別解決
其他棋型有手數長的單行道的話 恐怕一般人類也不是這麼容易看清
但是職棋應該是有機會得多...
(P.S.其實我覺得中盤阿法狗那些莫名其妙的著手也是跟單行道有關...雖然人類
看得很明白我都應對你這些來鬧的著手都沒有用 但是對電腦而言你只要中間一手下錯
我就出棋逆轉了 所以判斷自己劣勢的時候就會來搞這些地方
就戰略來講是對的(落後要搞棋)
只是戰術上來講
他選擇了隨機模擬時對手有可能下錯 但實際上人類不可能應錯的點
所以那些棋就人的眼光看起來很可笑 但我不覺得這是bug)
作者: aaaba (小強)   2016-03-14 21:11:00
印象中rollout有避免被吃子的policy
作者: ilw4e (可以吃嗎?)   2016-03-14 21:28:00
手數長的唯一解對人類來說就是區域的窮舉法,這人腦有優勢
作者: birdy590 (Birdy)   2016-03-14 21:31:00
mcts不是隨機下子 所以這結果無法預測
作者: pichu215 (用紅茶澆花)   2016-03-14 21:40:00
想看alphaGO下大雪崩定石的各種變化...
作者: hanmas   2016-03-14 21:43:00
ladder是他神經網路的基本參數 審盤時就直接算玩死活了論文附表有寫
作者: zeat (L.)   2016-03-14 21:46:00
古力講第三盤提到的活征不知道alphago會不會
作者: Mugen0413 (無聊的過日子)   2016-03-14 21:59:00
下大雪崩真的會累死棋士 XD 可以試試看啦 也要阿發師願意應才行
作者: zeat (L.)   2016-03-14 22:02:00
說不定alphago遇到大雪崩或大斜千變這種棋都會選簡單定型的變化(OS:誰跟你算到死
作者: maplefoxs (狐狸怎麼叫)   2016-03-14 23:11:00
但它可能不會乖乖征,要弄出一個夠大的征子不容易
作者: MicroB ( )   2016-03-15 01:43:00
AG的模擬走子網路有3段 不是光隨機亂下的李世石是和幾百個能高速運算的三段對決

Links booklink

Contact Us: admin [ a t ] ucptt.com