Demis Hassabis推特:(Deepmind 創辦人&CEO, 以下翻譯差勿怪)
https://twitter.com/demishassabis
兩小時前: 李世石下得很好!AlphaGo本來認為自己下得很好,但在87手迷惑了。
我們現在有麻煩了...
一小時前: 錯誤發生在第79手,但AlphaGo到87手才意識到這點。
(按: 自然地想跟78手有些關係,不過這裡沒有說明)
43分鐘前: 我的『認為』和『意識』,我指的是AlphaGo的價值網路(value net)的回報,
在79手時回報勝率是70%,但到87手就沉下去了。
34分鐘前: 李世石贏了!! 恭喜,他今天對我們太好了。壓迫了AlphaGo讓它犯出大錯。
作者:
DiAbLoE (?)
2016-03-13 17:23:00他的評價網路
deepmind的好消息 google仍要繼續投資
作者:
DiAbLoE (?)
2016-03-13 17:26:00如果他的蒙特卡羅搜尋跟決策網路要這麼多手後才能得到評價網路的反饋
不太可能 所以就不懂為什麼到87手才反饋到79時就應該降低了 但到87才直線下降 顯然是有bug
我自己會猜是缺乏某種很特定的能力,或者說在某個特定
作者:
doom3 (ⓓⓞⓞⓜ③ )
2016-03-13 17:31:00他是看勝率 79手有70% 87手開始降 所以狗算不出10手後阿
作者:
BusterPosey (Barca!Giants!Rafa!)
2016-03-13 17:32:00有時棋勢會在剛下時沒啥變化 在後面幾手才會突顯出來
作者:
Samurai (aa)
2016-03-13 17:33:00AI不是窮舉,就是79~87內容不在他計算發展內而已
感覺是那一手電腦沒投入太多計算,所以認為勝率很差等到87手發現勝率降低,開始投入計算研究前面幾手才發現其實那一手其實是好手,可是來不及了
作者: CNSaya (寂寞細肩帶) 2016-03-13 17:38:00
李成功抓蟲
作者:
signm (sin)
2016-03-13 17:46:00應該是電腦看棋盤不是我們的角度,它認為79步是好棋
其實不知道說79手失誤是AlphaGo自己發現,還是團隊發現如果是前者,那聽起來比較像是在說AG也覺得78是超好手,如果是後者,那也許就是79手本身也有相當問題@@
作者:
CGary (下雨天也挺浪漫的)
2016-03-13 17:59:00團隊沒這棋力發現 應該是alphago自己回饋的
噢我是說團隊可能用AG為基礎另外做了一套分析程式之類
作者:
Uizmp (黑袍法師)
2016-03-13 18:04:00一個猜想, 或許是AlphaGo發現在79手之後, 被對方連續幾手下在他判斷會輸的那一邊,然後自己的勝率狂掉,到87無力回天
作者:
BusterPosey (Barca!Giants!Rafa!)
2016-03-13 18:12:00我記得79手不算太大的失誤吧 是後面到左下挖那一手才算吧 還有右邊那個立下
嗯,我用語不準確,應該說AG可能自己認為79有相當問題
作者:
arcworld (人生究竟是什麼呢?)
2016-03-13 18:18:00如果78成立勝負手,那問題只會出現在78手之前因為不該下成能讓小李下出78手的局面...前因才是關鍵
嗯,可能代表AlphaGo一直沒有意識到78手,所以這樣判斷
作者:
birdy590 (Birdy)
2016-03-13 19:22:00顯然是計算的時候就漏了這支 如果有應對早就下出來了 XD