Re: [爆卦] AlphaGo發現自己79步失誤 darkseer PTT批踢踢實業坊

Re: [爆卦] AlphaGo發現自己79步失誤

作者: darkseer 2016-03-13 17:22:55

Demis Hassabis推特：(Deepmind 創辦人&CEO, 以下翻譯差勿怪)
https://twitter.com/demishassabis
兩小時前: 李世石下得很好！AlphaGo本來認為自己下得很好，但在87手迷惑了。
我們現在有麻煩了...
一小時前: 錯誤發生在第79手，但AlphaGo到87手才意識到這點。
(按: 自然地想跟78手有些關係，不過這裡沒有說明)
43分鐘前: 我的『認為』和『意識』，我指的是AlphaGo的價值網路(value net)的回報，
在79手時回報勝率是70%，但到87手就沉下去了。
34分鐘前: 李世石贏了!! 恭喜，他今天對我們太好了。壓迫了AlphaGo讓它犯出大錯。

作者: DiAbLoE (?) 2016-03-13 17:23:00

他的評價網路

作者: goldduck (哥達鴨) 2016-03-13 17:25:00

deepmind的好消息 google仍要繼續投資

作者: DiAbLoE (?) 2016-03-13 17:26:00

如果他的蒙特卡羅搜尋跟決策網路要這麼多手後才能得到評價網路的反饋

作者: goldduck (哥達鴨) 2016-03-13 17:26:00

李只是鬆口氣

作者: ykes60513 (いちご) 2016-03-13 17:27:00

不太可能所以就不懂為什麼到87手才反饋到79時就應該降低了但到87才直線下降顯然是有bug

作者: notmuchmoney (真的不錯....) 2016-03-13 17:30:00

AlphaGO這問題頗大不好解決

作者: darkseer 2016-03-13 17:31:00

我自己會猜是缺乏某種很特定的能力，或者說在某個特定

作者: HeculePoirot (idooo灌一年我灌30年) 2016-03-13 17:31:00

這不是好事嗎？本來就是要測出bug阿

作者: doom3 (ⓓⓞⓞⓜ③ ) 2016-03-13 17:31:00

他是看勝率 79手有70% 87手開始降所以狗算不出10手後阿

作者: BusterPosey (Barca!Giants!Rafa!) 2016-03-13 17:32:00

有時棋勢會在剛下時沒啥變化在後面幾手才會突顯出來

作者: Samurai (aa) 2016-03-13 17:33:00

AI不是窮舉，就是79~87內容不在他計算發展內而已

作者: kenny2963 (與風吹拂) 2016-03-13 17:34:00

感覺是那一手電腦沒投入太多計算，所以認為勝率很差等到87手發現勝率降低，開始投入計算研究前面幾手才發現其實那一手其實是好手，可是來不及了

作者: CNSaya (寂寞細肩帶) 2016-03-13 17:38:00

李成功抓蟲

作者: davidpanda (panda) 2016-03-13 17:42:00

MCTS其實是去模擬電腦覺得比較有可能的下法

作者: darkseer 2016-03-13 17:42:00

問問題，對於78手，職業棋士認為79是壞手嗎?

作者: signm (sin) 2016-03-13 17:46:00

應該是電腦看棋盤不是我們的角度，它認為79步是好棋

作者: hbl420ii (coir) 2016-03-13 17:46:00

阿發狗下班別偷看統神台阿真的變87了

作者: darkseer 2016-03-13 17:57:00

其實不知道說79手失誤是AlphaGo自己發現，還是團隊發現如果是前者，那聽起來比較像是在說AG也覺得78是超好手，如果是後者，那也許就是79手本身也有相當問題@@

作者: CGary (下雨天也挺浪漫的) 2016-03-13 17:59:00

團隊沒這棋力發現應該是alphago自己回饋的

作者: darkseer 2016-03-13 18:03:00

噢我是說團隊可能用AG為基礎另外做了一套分析程式之類

作者: Uizmp (黑袍法師) 2016-03-13 18:04:00

一個猜想, 或許是AlphaGo發現在79手之後, 被對方連續幾手下在他判斷會輸的那一邊,然後自己的勝率狂掉,到87無力回天

作者: BusterPosey (Barca!Giants!Rafa!) 2016-03-13 18:12:00

我記得79手不算太大的失誤吧是後面到左下挖那一手才算吧還有右邊那個立下

作者: darkseer 2016-03-13 18:16:00

嗯，我用語不準確，應該說AG可能自己認為79有相當問題

作者: arcworld (人生究竟是什麼呢？) 2016-03-13 18:18:00

如果78成立勝負手，那問題只會出現在78手之前因為不該下成能讓小李下出78手的局面...前因才是關鍵

作者: darkseer 2016-03-13 18:23:00

嗯，可能代表AlphaGo一直沒有意識到78手，所以這樣判斷

作者: Palpatineli (Chancellor) 2016-03-13 19:19:00

也許ag判斷78其實是有應對的？

作者: birdy590 (Birdy) 2016-03-13 19:22:00

顯然是計算的時候就漏了這支如果有應對早就下出來了 XD

繼續閱讀

[新聞] 李世石算出神之一手逼電腦出錯扳回一城 zkow Re: [爆卦] AlphaGo發現自己79步失誤thid5335 Fw: [爆卦] AlphaGo發現自己79步失誤tsppajrdrrfs [新聞] 柯潔：李世石贏回尊嚴電腦挑戰我不夠格zkow [新聞] 中國版AlphaGo還太嫩僅業餘二段水準qweewqq [新聞] 反擊！李世石終戰勝阿爾法贏回人類尊嚴zkow [閒聊] AlphaGo認輸了!!andrenvq57 [閒聊] alphago和自己下百萬棋可能導致自我汙染?hayuyang [心得] 圍棋AI AlphaGo 之我見kafai Re: [閒聊] 人氣紀錄joy3252355