Re: [影片] 張東岳解說李世石獲勝第四盤

作者: mathbug (天堂的定義)   2016-03-14 08:56:56
※ 引述《nanlong (懶龍)》之銘言:
: ※ 引述《zkow (逍遙山水憶秋年)》之銘言:
: : 圍棋世紀人機大戰李世石 vs AlphaGo 第四盤
: : 張東岳點評:彌足珍貴的一場勝利【圍棋TV】
: : https://www.youtube.com/watch?v=00HP4e8e_iQ
: : 解說詳細,長達二十幾分鐘,可看看
: 看了影片及網路一些高手解說後
: 才知那手還真不是 圍棋 所說的神之一手
: , 因為對手冷靜下來想就有幾種應法都可不吃虧繼續領先
: 甚至直接讓棋局告終。
: 不過實戰結果卻有讓狗狗中風的奇效 算是另一類的 "神之一手" 哈。
: ps: 棋界的神之一手大概是說 讓所有人在事前事 後
: 怎樣想都無法抵抗的勝著妙手吧。
: 有時對手會驚訝到 "含笑九泉" ~~
有可能這是這一代AlphaGo系統伴隨的不穩定性
請參考 我的文章 #1MvKziMw
這也是為什麼AlphaGo所有的選擇都傾向 簡明 + 高勝率
這在系統工程上不是小問題
問題的解決有可能需要讓AlphaGo加上一個穩定係數/函數
當盤面/系統的不穩定情況大增 計算方式或是記算量需要調整
作者: darkseer   2016-03-14 09:05:00
等等,你上一篇文章沒有解釋為什麼會傾向簡明+高勝率呀?
作者: Uizmp (黑袍法師)   2016-03-14 09:32:00
我個人是覺得 AG自身學習的結論, 對含有打劫的分支權重偏低有可能是樣本不夠多, 有可能是多重劫的分支很難有效展開因此都會採取避免打劫的的方式進行
作者: darkseer   2016-03-14 09:37:00
不過這樣子會不會反而輕忽對手可以導入打劫的下子?純粹討論AI,如果AlphaGo自己覺得打劫很不好,那應該同時會輕忽李九段可以導入打劫的棋手,但看了職業講解不像
作者: Uizmp (黑袍法師)   2016-03-14 09:39:00
很有可能,前三盤要不就是成功避開,要不就是打劫影響不夠大
作者: darkseer   2016-03-14 09:41:00
因為我聽講解好像是說,李九段本來有機會打劫,但AG規避當然像你說的,只有三盤本來我這樣想就很容易有盲點XD
作者: Uizmp (黑袍法師)   2016-03-14 09:44:00
不太懂你上面兩段說的, 輕忽導入打劫的棋手 vs AG規避這兩件事情不一樣嗎? 我的意思是AG對往打劫的分支權重較低
作者: darkseer   2016-03-14 09:45:00
噢sorry,我是說,單論他們paper內容,搜尋樹對黑白對稱所以如果覺得黑主動挑起劫爭是壞棋,那反過來應該也會,也就是會樂意製造讓對手有機會產生劫爭的棋步,但前三盤轉播的看法好像與此相反,認為AG會規避劫爭
作者: Uizmp (黑袍法師)   2016-03-14 09:50:00
我猜是自我對弈的中,不管AG執黑或白,打劫分支都會降低勝率打劫分支的展開可能會比避劫多出很多,而且勝負難料,算不完
作者: darkseer   2016-03-14 09:57:00
黑白同時降低勝率這個我自己覺得是演算法的基本錯誤XD
作者: Uizmp (黑袍法師)   2016-03-14 09:57:00
假設打劫雙方都討不了好,勝率50%,當時避劫AG評估將近80%
作者: Uizmp (黑袍法師)   2016-03-14 09:58:00
以50%舉例, 就是說對黑方不利, 白方有利至於 97 那邊我覺得是另外一個問題
作者: darkseer   2016-03-14 09:59:00
對不起97舉例可能不太好,譬如說93 :p 只是類比
作者: Uizmp (黑袍法師)   2016-03-14 09:59:00
之前的棋局裡面, 好像還沒有逼到AG勝率低迷的情況 ?
作者: darkseer   2016-03-14 10:00:00
嗯嗯,我不反對你的結論XD對不起補充一下,你說的對,我主要就是因為這裡是圍棋板
作者: Uizmp (黑袍法師)   2016-03-14 10:07:00
搞不好AG還有一個"靠北,算不完,我不要打劫"的價值評估
作者: darkseer   2016-03-14 10:08:00
覺得應該強調『演算法的結論是AI可能在優勢時避免劫爭』說不定XD 也許圍棋高手會得到這樣的結論 :p但是從演算法的觀點沒有理由特別相信這樣..吧? :D
作者: aaaba (小強)   2016-03-14 10:12:00
看你ID,應該是懂點數學,請解釋在NN這種高度非線性函數裡,什麼叫穩定係數。你要說得那麼空泛,乾脆推文就可以了
作者: doomhydra (認真活每一天)   2016-03-14 10:48:00
學點 deep learning 再來好嗎? 一篇一篇打臉很累
作者: aaaba (小強)   2016-03-14 17:35:00
抱歉,我看不出alphaGo有回授

Links booklink

Contact Us: admin [ a t ] ucptt.com