Re: [爆卦] AlphaGo發現自己79步失誤 tlchen PTT批踢踢實業坊

Re: [爆卦] AlphaGo發現自己79步失誤

作者: tlchen (台灣加油) 2016-03-13 18:53:46

※ 引述《tsppajrdrrfs ()》之銘言：
: ※ [本文轉錄自 Gossiping 看板 #1MvIov-I ]
: 作者: n91324 (不丹) 看板: Gossiping
: 標題: [爆卦] AlphaGo發現自己79步失誤
: 時間: Sun Mar 13 17:02:45 2016
: Deep Mind 創辦人在推特表示
: Mistake was on move 79, but #AlphaGo only came to that realisation on around move 87
: 所以AG確實在79有失誤
: 而且她下到87才發現自己之前的失誤
: 補上推特:
: 推 OrzJ: https://twitter.com/demishassabis 推特
從這兩個 twitter 來看， AI 在 79 時仍認為自己有 79% 的勝率，
直到第 87 手時，才發現勝率驟降。四日棋迷猜測如下：
AI 估計勝率是經由之後的模擬，白 78 手被認為神手，但或許是之後
的巧妙變化是不明顯的，所以 AI 無法知道這手有這麼大的功用，或
是說，無法準確的評估此時的盤面。
要知道，AI 的估算是根據之後的模擬，它並沒有人類邏輯式的推演，
所以它不見得能得到之後的最佳變化。某種意思下，它是取模擬的加權
平均，但只要之後最佳的應對沒被模擬到，它的評估自然不準。又或者
是，最佳應對跟其它應對方的結果差很多，若不能給最佳應對接近 1
的權重，那它的評估就失準。
而隨著棋局變化，又多下了幾手，能變化的地方變少，AI 自然比較能
模擬到正確的應對，才驚覺自己已經落後。
這提供了要對付目前這版 AlphaGo 的方法，你最好下一些方法是：接
下來對你的最佳解跟次佳解，結果會差很多，這樣 AI 用模擬的，就有
機會誤判。如果你下的棋，接下來的應對，結果都差不了太多，那 AI
自然估得準。讓它估不準，才會在接下來還沒估準前，繼續出錯。

作者: kingrichman (silent all these years) 2016-03-13 18:55:00

AI遇到沒遇過狀況，但這次他就記起來了相同的招以後想再用就沒用了

作者: aegis43210 (宇宙) 2016-03-13 18:57:00

所以由此可見得黑77手那時，alphaGO的勝算有多大…

作者: ilw4e (可以吃嗎？) 2016-03-13 19:00:00

他勝算大是認定他跑的圖都把白吃光了吧，暴動手筋沒算到

作者: wnglon (冷面笑匠) 2016-03-13 19:01:00

不一定如果稍微改變幾個棋子 BUG還是存在因為這是程式阿必須根本性解決這問題

作者: indium111 (#ttyhg) 2016-03-13 19:01:00

那時候直播的職業棋手幾乎都認為李快要四連敗了直到李世石78的神之一手才逆轉大家的看法

作者: Uizmp (黑袍法師) 2016-03-13 19:05:00

既然有所謂的勝率, 就有被AG認為會敗的招

作者: derekhsu (è¯éº—çš„å¤©ä¸‹ç„¡é›™) 2016-03-13 19:06:00

AlphaGo不能即時學習要重新訓練

作者: Uizmp (黑袍法師) 2016-03-13 19:07:00

很有可能在78手起連續被打在AG評估會敗的地方導致勝率狂掉

作者: JDKnife (絕地小刀) 2016-03-13 19:07:00

最好是逆轉...那邊本來就有手段不只78那個位置

作者: Uizmp (黑袍法師) 2016-03-13 19:08:00

到87手的時候 AG 發現自己的勝率掉到某個門檻以下

作者: siyaoran (七星) 2016-03-13 19:08:00

是逆轉吧電腦勝率從79%掉還有職九們覺得李要輸了

作者: aegis43210 (宇宙) 2016-03-13 19:08:00

有比挖更好的下法嗎？這一步李世石想了十五分鐘的說

作者: siyaoran (七星) 2016-03-13 19:09:00

依照古力和柯潔的下法明明就還差很多

作者: BusterPosey (Barca!Giants!Rafa!) 2016-03-13 19:09:00

版上有不世出的高手啊請賜教

作者: deacon (deacon) 2016-03-13 19:10:00

這手很明顯連alphago也沒算到不然後面不會崩潰那麼明顯

作者: NaoGaTsu (那歐卡茲) 2016-03-13 19:10:00

78手改下靠的話，結果真的難料...

作者: siyaoran (七星) 2016-03-13 19:16:00

AI不能快速從錯誤中學習的確還有一大段路要走

作者: DemonElf (LdsFish) 2016-03-13 19:29:00

Alphago之所以有別於以往的圍棋AI就是他能學習成長好嗎

作者: smallyuki (smallyuki) 2016-03-13 19:32:00

覺得要逼狗犯無可挽回的大錯有兩個條件第一是極佳的妙手，第二是這一手遠超出狗的預期範圍

作者: DemonElf (LdsFish) 2016-03-13 19:37:00

李能下出超出預期的這一手真的是很難得，別忘了Alphago已經自我對奕超過三千萬盤棋

作者: Uizmp (黑袍法師) 2016-03-13 19:52:00

其實也有個弔詭的地方, 勝率接近八成代表還有兩成可破說不定2成中就會有像今天這種一下子把勝率壓到很低的走法

作者: danibaba5566 (BABA56) 2016-03-13 20:10:00

78手確實是手筋

作者: utap2001 (尋找一個漫長的答案 ) 2016-03-13 20:39:00

李也說78手是唯一一手所以他也知道他那時候勝率有2成而2成的勝率就要從這裡突破他跟alphago想的都一樣

作者: mothertime (我超愛傅紅雪這變態) 2016-03-13 21:45:00

alphago好像不會記得這幾盤棋

作者: fywei (應無所住而生其心) 2016-03-13 22:28:00

軟體用的是大數據training 不會去特別對應某種情況

繼續閱讀

[心得] Alphago的弱點cscscscs22 [新聞] 李世石申請最終局執黑稱這樣獲勝更有意義zkow [新聞] 黑嘉嘉讚李世石有勇氣AAAC [情報] 詳訊：圍棋人機大戰第四局李世石贏得首勝pf775 Fw: [問卦]世界圍棋排名前127都是男人？屌打女棋手!KsSteven [問題] 關於讀秒sck921 [棋訊] 葉罡廷7段人機大戰第3.4盤實況預告mariakoutei [閒聊] 賽後訪問小記queenghost [新聞] 阿爾法突然大抽瘋谷歌:人類點中了它的BUGzkow Re: [爆卦] AlphaGo發現自己79步失誤yamiyodare