Re: [心得] 圍棋AI AlphaGo 之我見 yamiyodare PTT批踢踢實業坊

Re: [心得] 圍棋AI AlphaGo 之我見

作者: yamiyodare (shantotto) 2016-03-15 08:30:28

※ 引述《mathbug (天堂的定義)》之銘言：
: 1. 據說 AlphaGo用到的Neuro Network深達13層
: 有任何穩定性的報告或是說明嗎？
論文裡有提到它預測的誤差
: 2. 圍棋的勝敗至少包括兩種，一種是壓著打或是完勝，另一種是反敗為勝
: AlphaGo的設計應該是循著第一條路線
: 問題是餵它的千萬盤訓練用人類棋譜卻包含非常多第二類棋譜
: 反敗為勝的棋譜應該非常多用的是勝負手(或是無理手)
: 不曉得這會不會是AlphaGo昨天崩潰的原因？
所謂千萬盤是自我對奕, 不是人類實戰譜, 人類高手實戰譜還沒那麼多.
看它跟小李下的棋路, 是第一種路線多? 還是第二種多?
: 3. 以現在AG的能力，它應該可以先歸類/分群將之前訓練的棋譜分開
: 重新訓練時只採用第一種壓著打或是完勝的棋譜
: 也許就不會有無理手的出現了 (或數學上讓它的系統參數穩定)
中間攻防輸掉是 AlphaGo 形勢判斷錯誤, 劣勢盤面還以為優勢繼續走損手.
後來左下角的挖被吞吃, 還有點影響到左邊黑棋的死活.
理論上決策樹會假設對方走最好的一手 (被吞吃), 而不是期待對方犯錯.
AlphaGo 有很多其他的著手選擇, 下起來都沒有那一手損導致勝率更低.
就算以 AI 的角度, 我也看不懂它在下甚麼.
難不成 AlphaGo 大幅落後時策略改成期待對方應錯翻盤?

作者: goldduck (哥達鴨) 2016-03-15 08:35:00

不能預期靠對方失誤來做判斷下棋所以這是很奇怪的事

作者: Dialysis (　　　　　　　　　　　) 2016-03-15 08:58:00

只要餵給alphago幾萬盤大幅落後的棋局,就會知道其應對了

作者: fermib (ohyah) 2016-03-15 09:15:00

可能是AG得模擬棋子裡是有一定程度隨機性的因為完全下得職業棋士一樣只能三段要有隨機性保持創造力才能到超9段但當每一步勝率都很低的時候隨機性可能會dominate勝率導至自殺棋? 模擬時因為兩方都有隨機性白方幾乎怎麼下都贏時黑方只有等白方模擬的隨機性發生才有勝率這就是預期白方失誤模擬時隨機性不能高不然就是兩個俗手在模擬贏不了李九段但又不能太低會太像舊譜只有三段實力

作者: tbrLeBlanc (黑玫瑰勒布朗) 2016-03-15 09:44:00

看看第四局開局很懷疑是不是真的有隨機性

繼續閱讀

[新聞] 寺山怜並非無名之輩世界第三井山裕太在哪zkow Re: [新聞] 寺山憐日本圍棋苦寒的背影望重新贏回尊重staristic [新聞] 韓國棋院遊記以圍棋為事業的人們zkow [轉錄] 第四局AlphaGo敗招的分析 ◎田淵棟hoisee [討論] 關於那所謂的神之一手wukevinboy Re: 從象棋觀點看AlphaGO為什麼會輸icepet0015 [棋訊] 葉罡廷7段人機大戰第3.4盤實況影片mariakoutei [討論] 或許類似征子的大型單行道棋形才是弱點Django [新聞] 韓媒：不應神化人機圍棋戰阿爾法應受尊重zkow [新聞] 寺山憐日本圍棋苦寒的背影望重新贏回尊重zkow