Fw: [情報] AlphaGo計畫領導人David Silver訪談

作者: Senkanseiki (戦艦棲姫)   2016-03-13 10:01:01
關鍵字 AlphaGo今年兩歲(欸
裡面也提供了一些擬人化可用的素材XD
※ [本文轉錄自 GO 看板 #1Mv9dFpX ]
作者: asglay (收收收尾) 看板: GO
標題: [情報] 不可思議的五路肩沖怎麼來的?
時間: Sun Mar 13 06:35:57 2016
https://www.youtube.com/watch?v=qUAmTYHEyM8&t=15m15s
第三戰賽前訪問重點整理 - 不可思議的五路肩沖怎麼來
AlphaGo 計畫的領導人David Silver
(重點聽譯 有誤請見諒)
1.
Redmond(美國九段)問:
第二戰的黑37手五路肩沖太令人驚訝了,
我從來沒看人家這樣下過,阿法狗是怎麼想出來的?
Silver回:
很多人都問我這個問題,我就回去找資料看看阿法狗到底是怎麼想出來的,
阿法狗有個模型,也就是方針網路(Policy Network),
是利用人類過去所下過的棋譜,來訓練這個方針網路,
讓這個模型可以預測人類下一步會怎麼下。
然後我就問阿法狗,到底過去人類會下這步五路肩沖的機率有多少?
阿法狗說,人類棋手只有萬分之一的機率會選擇下五路肩沖這步棋。
(咩按:怪不得李世石要中離去抽菸啊~根本整人嘛)
雖然機率很低,但阿法狗還是有去搜尋這步棋,
經過往下評估計算之後(Roll Out),發現這步真的是好棋,所以就下了這步棋。
2.
Redmond問:
即使人類下的機率這麼低,阿法狗還是選擇這樣下了,
表示人類選擇怎麼下的機率不會影響到阿法狗嗎?
Silver回:
人類下一步怎麼下的機率,只是在最開始的時候,提供阿法狗一些搜尋的初始選項,
實際會怎麼下還是要依靠阿法狗自己後續的評估結果。
(咩按:所以阿法狗有點像是依靠人類的過去下過的棋步,
來捨棄一些根本不需要考慮的位置,所以初手大元還是有可能的(誤))
3.
Garlock問:
阿法狗幾歲?(咩按:這問題...)
Silver回:
兩歲。(咩按:開始講一些古,台灣之光AlphaGo的臉,黃士傑,巴拉巴拉)
去年發表論文,發現光練習古人的譜,不用做任何計算,AI就可以有業餘段位水準,
整個很吃驚。所以就覺得很有希望,跑去找CEO談談,結果就開了projetc,
找了很多人進來,成就了阿法狗跟這場世紀之戰。
4.
Redmond問:
阿法狗打敗了世界冠軍,有人說你們有針對李世石做軟體上的調整,
但剛剛聽你講起來發現好像不太可能?
Silver回:
阿法狗是用幾十萬份的棋譜去訓練出來的,李世石的譜在數量上相比起來,
就好像把一滴水丟到大海裡一樣,
不太可能顯著的去影響阿法狗的棋風,而且阿法狗還有很多自我對局的強化學習。
對我來講,我們很難調整阿法狗去針對李世石,
相反的,李世石是一個很棒的棋手,
他比我們還更可能去適應阿法狗的棋風。(咩按:其實還挺有道理的)
而且只針對一個棋手去調整,其實還蠻危險的。
我們的設計目標很簡單,就是設計一個程式來讓勝利的機率最大化。
我們在比賽前我們還中止了阿法狗的發展進程,讓我們可以順利測試,
所以在比賽過程中,程式的版本其實是沒有改變的。
5.
Redmond問:
你覺得像五路肩沖這種神奇棋步,有可能會持續出現嗎?
Silver回:
我們在比賽中學到很多,從像你這樣的解說評論與分析等等,
我們選擇李世石也是認為他可以測試到阿法狗的極限,
但其實我們不知道阿法狗會怎麼下。
我們雖然創造它,但這時候也只能站旁邊看它會怎麼下,
不然我現在應該是在努力coding,而不是來接受訪問。
(咩按:AI可以讓你不用再當好人工程師)
6.
Garlock問:
我聽說阿法狗現在好像甚至不需要人類過去的棋譜來輔助?
聽說可以從零開始左右互搏訓練,也太讓人驚訝了吧
Silver回:
目前阿法狗的確是從人類過去的棋譜來學習,
但是從零開始訓練,的確是我們未來的計劃,
或許棋風會變得很不一樣也說不定。
(咩按:最後再說了一些這可能是五百年來最出名的圍棋賽等等...)
作者: darkseer   2015-03-13 06:38:00
作者: pikachu2421 (皮卡@めぐ民)   2015-03-13 06:46:00
感謝翻譯
作者: darkseer   2015-03-13 07:03:00
再推一次XD,重點擷得太好了話說按照圍棋用語會不會稱他是日本九段? :p
作者: aaaba (小強)   2015-03-13 07:07:00
太狂了!人類哪有機會在有限時間內探索機率只有萬分之一的分支!
作者: Eriri (英梨梨)   2015-03-13 07:09:00
我覺得有意義的是去套討為什麼阿法狗會認為那是好棋人不是因為萬分之一沒有時間想到 而是因為普遍不會認為那是好棋 才選擇不下 讓機率變成萬分之一
作者: aaaba (小強)   2015-03-13 07:29:00
成為好棋的原因就是alphaGo把那步棋在想像中下了幾千次,盡可能探索各種變化,結果還不錯,就真的選擇下了。
作者: Eriri (英梨梨)   2015-03-13 07:30:00
所以我的意思就是那些變化到底可不可以慢慢被人歸納 還是像這些手是永遠模仿不能的 不過有些人認為勝率高不代表是好棋我是覺得既然AG算到那麼多步還認為這是勝率最高的一手 那就有研究的價值
作者: aaaba (小強)   2015-03-13 07:45:00
我個人意見是如果並非只牽扯到局部,而是廣泛影響到全局的好手,人不必研究了,AG已經研究過了,讓他把其中幾個變化輸出給人聞香就好了。再怎麼樣探索,單憑人力,下次在比賽中出現類似的盤面,也只能強記,無法即時探索更遠。但當人開始強記無法消化的棋步,棋這門可稱作藝術的競技就感覺沒有美感了。
作者: enomis (enomis)   2015-03-13 07:58:00
日本棋手表示:你們開始重視下棋的美感了嗎^_^
作者: aaaba (小強)   2015-03-13 08:01:00
感謝阿發狗促成圍棋必須講究美感的共識
作者: ForeverOrz (Lumis eterne)   2015-03-13 08:08:00
我覺得換個問法五路尖衝小李為何不爬四路那邊要出頭
作者: darkseer   2015-03-13 08:19:00
推樓上。也許後續又有什麼很不像人類的妙手配合?
作者: allenmusic (艾倫)   2015-03-13 08:35:00
好文
作者: turing (涂妮)   2015-03-13 09:22:00
開盤階段平均每個點被考慮到的機率是千分之三。對電腦而言萬分之一其實不低。至少它還排在候選名單中。我想會不會開盤時所有三四五路的點都想一下。
作者: MaseratiGTS (海神三叉戟)   2015-03-13 09:24:00
人類要脫離制式規範被舊有經驗侷限創意才有辦法打敗阿法狗
作者: darkseer   2015-03-13 09:25:00
我覺得萬分之一感覺上已經很接近要被剪掉了耶@@至少傳統minimax的變體,如果統計上最佳解機率萬分之一應該就cut掉了唄?
作者: MaseratiGTS (海神三叉戟)   2015-03-13 09:26:00
以前覺得不可行的事實上是因為經驗累積但人類經驗只占不知道幾個百分比而已
作者: ming1053 (ming)   2015-03-13 09:27:00
萬分之一是職業棋譜帶來的 bias 後面他還是有自己考慮
作者: chordate (封侯事在)   2015-03-13 09:27:00
萬分之一是高段職業棋手下出的可能性AlphaGo原理上會先用職業棋譜嘗試排除那些必敗的下法
作者: darkseer   2015-03-13 09:28:00
對orz 我想錯了,關鍵是rollout算到底可能還比SL策略網路快,沒理由不同時rollout一下
作者: aaaba (小強)   2015-03-13 09:46:00
其實如果萬分之一的機率在所有候選點的排名還有前二十,那機器還滿有餘裕去細究的。
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2015-03-13 09:53:00
我很悲觀地想 那五路肩衝不是賽中臨時測試出來的而是平時自我對練發現的 而且已融入AlphaGO自身 也就是
作者: LCamel (LCamel)   2015-03-13 09:53:00
網路上有些人說 "AlphaGo 吸收了人類百年千年來的經驗
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2015-03-13 09:54:00
AlphaGO在比賽前 就已經準備了數量不知多少的妙手 等著
作者: LCamel (LCamel)   2015-03-13 09:54:00
所以贏李是自然的" 但是從37手前人只有萬分之一的機率來看
作者: LCamel (LCamel)   2015-03-13 09:55:00
這個說法已經不攻自破了. 37 手 AlphaGo 是靠自己下的.對不起 moonlind 和你交叉了 orz
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2015-03-13 09:57:00
沒關係啦 我很期待沒人類經驗的AlphaGO跟目前的對戰藉此測試究竟人類的經驗究竟孰輕孰重 若勝率50% 很可能代表 人類所謂經驗 僅滄海一粟 如果勝率低於50%...更慘 代表人類有自我的盲點 並且累積成不可忽視的缺失
作者: SuperSg (萌翻天的時代來啦°▽°)   2016-03-13 10:13:00
李師傅,攻他電路
作者: ron761230 (Ron)   2016-03-13 10:24:00
alpha go 還能查出出棋思路啊,我還以為資料太多沒法查
作者: arrenwu (鍵盤的戰鬼)   2016-03-13 10:26:00
他應該是有相關參數紀錄可以查但應該沒有像對話中那樣「我問AlphaGO」這麼親切XD
作者: jasonchangki (阿特拉斯聳聳肩)   2016-03-13 10:28:00
我以為我在圍棋板看XD ACG點勒
作者: Senkanseiki (戦艦棲姫)   2016-03-13 10:30:00
兩歲,註定是個蘿莉(X
作者: stevey (韓狗人死一死)   2016-03-13 10:37:00
不能是正太嗎?正太阿光超萌的啊
作者: shizukuasn (SCP-999超萌)   2016-03-13 10:37:00
我問AlphaGO 怎麼聽起來有點可愛XDD
作者: bxxl (bool)   2016-03-13 10:40:00
可以啊,裝個類Siri界面就能用自然語言查詢
作者: avrild12 (78elic)   2016-03-13 10:41:00
不是蘿莉的話就沒屁用了
作者: QBian (小妹QB子)   2016-03-13 11:02:00
大胸蘿
作者: CP64 (( ̄▽ ̄#)﹏﹏)   2016-03-13 11:14:00
只好提議他們讓 AlphaGo 以後用機械手臂下了 (X
作者: hdjj (hdjj)   2016-03-13 11:17:00
五路肩衝在武宮正樹時期就有了,五五肩衝星位
作者: DarkHolbach (宇智boyo)   2016-03-13 11:22:00
http://imgur.com/tvzGeQt 阿發狗擬人
作者: anlam (木田)   2016-03-13 11:31:00
雖然沒意義不過正太一票
作者: bladesinger   2016-03-13 11:41:00
Alphago真正對圍棋的價值是揭示了很多圍棋界忽略的可能性,就跟吳清源當年挑戰本因坊秀哉下在「大逆不道的星位、三三,為什麼之前的人都認為這是臭手?
作者: sdhpipt   2016-03-13 12:18:00
因為沒有足夠研究中國反而不會覺得下星位有什麼,因為最早是要座子

Links booklink

Contact Us: admin [ a t ] ucptt.com