Re: [爆卦] AlphaGo發現自己79步失誤

作者: tlchen (台灣加油)   2016-03-13 18:53:46
※ 引述《tsppajrdrrfs ()》之銘言:
: ※ [本文轉錄自 Gossiping 看板 #1MvIov-I ]
: 作者: n91324 (不丹) 看板: Gossiping
: 標題: [爆卦] AlphaGo發現自己79步失誤
: 時間: Sun Mar 13 17:02:45 2016
: Deep Mind 創辦人在推特表示
: Mistake was on move 79, but #AlphaGo only came to that realisation on around move 87
: 所以AG確實在79有失誤
: 而且她下到87才發現自己之前的失誤
: 補上推特:
: 推 OrzJ: https://twitter.com/demishassabis 推特
從這兩個 twitter 來看, AI 在 79 時仍認為自己有 79% 的勝率,
直到第 87 手時,才發現勝率驟降。四日棋迷猜測如下:
AI 估計勝率是經由之後的模擬,白 78 手被認為神手,但或許是之後
的巧妙變化是不明顯的,所以 AI 無法知道這手有這麼大的功用,或
是說,無法準確的評估此時的盤面。
要知道,AI 的估算是根據之後的模擬,它並沒有人類邏輯式的推演,
所以它不見得能得到之後的最佳變化。某種意思下,它是取模擬的加權
平均,但只要之後最佳的應對沒被模擬到,它的評估自然不準。又或者
是,最佳應對跟其它應對方的結果差很多,若不能給最佳應對接近 1
的權重,那它的評估就失準。
而隨著棋局變化,又多下了幾手,能變化的地方變少,AI 自然比較能
模擬到正確的應對,才驚覺自己已經落後。
這提供了要對付目前這版 AlphaGo 的方法,你最好下一些方法是:接
下來對你的最佳解跟次佳解,結果會差很多,這樣 AI 用模擬的,就有
機會誤判。如果你下的棋,接下來的應對,結果都差不了太多,那 AI
自然估得準。讓它估不準,才會在接下來還沒估準前,繼續出錯。
作者: kingrichman (silent all these years)   2016-03-13 18:55:00
AI遇到沒遇過狀況,但這次他就記起來了相同的招以後想再用就沒用了
作者: aegis43210 (宇宙)   2016-03-13 18:57:00
所以由此可見得黑77手那時,alphaGO的勝算有多大…
作者: ilw4e (可以吃嗎?)   2016-03-13 19:00:00
他勝算大是認定他跑的圖都把白吃光了吧,暴動手筋沒算到
作者: wnglon (冷面笑匠)   2016-03-13 19:01:00
不一定 如果稍微改變幾個棋子 BUG還是存在 因為這是程式阿必須根本性解決這問題
作者: indium111 (#ttyhg)   2016-03-13 19:01:00
那時候直播的職業棋手幾乎都認為李快要四連敗了直到李世石78的神之一手才逆轉大家的看法
作者: Uizmp (黑袍法師)   2016-03-13 19:05:00
既然有所謂的勝率, 就有被AG認為會敗的招
作者: derekhsu (華麗的天下無雙)   2016-03-13 19:06:00
AlphaGo不能即時學習要重新訓練
作者: Uizmp (黑袍法師)   2016-03-13 19:07:00
很有可能在78手起連續被打在AG評估會敗的地方導致勝率狂掉
作者: JDKnife (絕地小刀)   2016-03-13 19:07:00
最好是逆轉...那邊本來就有手段 不只78那個位置
作者: Uizmp (黑袍法師)   2016-03-13 19:08:00
到87手的時候 AG 發現自己的勝率掉到某個門檻以下
作者: siyaoran (七星)   2016-03-13 19:08:00
是逆轉吧 電腦勝率從79%掉 還有職九們覺得李要輸了
作者: aegis43210 (宇宙)   2016-03-13 19:08:00
有比挖更好的下法嗎?這一步李世石想了十五分鐘的說
作者: siyaoran (七星)   2016-03-13 19:09:00
依照古力和柯潔的下法明明就還差很多
作者: BusterPosey (Barca!Giants!Rafa!)   2016-03-13 19:09:00
版上有不世出的高手啊 請賜教
作者: deacon (deacon)   2016-03-13 19:10:00
這手很明顯連alphago也沒算到 不然後面不會崩潰那麼明顯
作者: NaoGaTsu (那歐卡茲)   2016-03-13 19:10:00
78手改下靠的話,結果真的難料...
作者: siyaoran (七星)   2016-03-13 19:16:00
AI不能快速從錯誤中學習的確還有一大段路要走
作者: DemonElf (LdsFish)   2016-03-13 19:29:00
Alphago之所以有別於以往的圍棋AI就是他能學習成長好嗎
作者: smallyuki (smallyuki)   2016-03-13 19:32:00
覺得要逼狗犯無可挽回的大錯有兩個條件第一是極佳的妙手,第二是這一手遠超出狗的預期範圍
作者: DemonElf (LdsFish)   2016-03-13 19:37:00
李能下出超出預期的這一手真的是很難得,別忘了Alphago已經自我對奕超過三千萬盤棋
作者: Uizmp (黑袍法師)   2016-03-13 19:52:00
其實也有個弔詭的地方, 勝率接近八成 代表還有兩成可破說不定2成中就會有像今天這種一下子把勝率壓到很低的走法
作者: danibaba5566 (BABA56)   2016-03-13 20:10:00
78手確實是手筋
作者: utap2001 (尋找一個漫長的答案 )   2016-03-13 20:39:00
李也說78手是唯一一手 所以他也知道他那時候勝率有2成而2成的勝率就要從這裡突破 他跟alphago想的都一樣
作者: mothertime (我超愛傅紅雪這變態)   2016-03-13 21:45:00
alphago好像不會記得這幾盤棋
作者: fywei (應無所住而生其心)   2016-03-13 22:28:00
軟體用的是大數據training 不會去特別對應某種情況

Links booklink

Contact Us: admin [ a t ] ucptt.com