Re: [討論] 李世石 VS AlphaGo 第二局看法

作者: ilw4e (可以吃嗎?)   2016-03-11 15:56:50
看很多不下棋的在那邊放話好像電腦每一步都是對的,覺得可以細想一下程式的原
理,畢竟目前的程式離真理還是有很大的差距的。我也只是個十幾年前的業四,也
不敢說要評棋,但一些簡單好壞應該還是可以講講。
棋類不像POKER、麻將、或撲克牌遊戲是機率遊戲,棋類很多地方是有唯一解的。用
死活詰棋當例子,如果電腦真的只是用機率判斷,勝率最高的那點可能是:
[對手應的若是那唯一解電腦必死,下其他任何點電腦都活,勝率99%]
電腦應該選擇這變化嗎?當然不該!
當然我相信AG程式裡會對必勝必敗的點做排除(不然可能連簡單攻殺都會出錯),但
我只是強調AG用所謂"最高勝率"判斷落子的策略也正是目前電腦應該還可以被擊敗
的原因。越早期的著手你要用勝敗機率來判斷越是困難,也很好理解為什麼電腦前
期容易出現惡棋。
柯潔講話那麼托大我覺得也是有原因的(當然我覺得他來下也不見得會贏),就是因
為電腦還是有出現明顯的壞棋。AG有些疑問手有可能是好棋,像11虎完13手拔,或
37尖沖這種過去普遍覺得不太好的,也許事實上並不太虧。
(解釋給X日棋迷:通常13要手拔不會先虎,因為那會把棋下重容易被攻。尖沖通常
認為對方若在3路你尖沖合理,對方在4路你讓人4路圍空通常是虧的,也就是為什
麼評論會認為小李怎樣都該往4路那邊壓而不該實戰往5路壓)
但43黏到61是黑不好的型這應該是沒甚麼爭議的。若實戰李沒有之後幾個緩手讓黑
下到73,而是早一步攻擊那塊弱棋,那應該會是白主動的局面。換個方向想,電腦
中間那坨單官下半天最後還要多花一手73來連回,想也知道不可能好。
因為棋不是機率遊戲,但電腦是用機率來判斷,因此人若能把握這點下出局部最佳
解應是可以在佔些便宜的。
作者: wen17 (祭祀風的人類)   2016-03-11 15:58:00
電腦資源不是無限 而電腦判斷計算難易的方法也跟人不同所以可能有部分落子人來看很容易計算出優劣 電腦很難
作者: sky0302 (free)   2016-03-11 15:58:00
本來就是這樣了 電腦又不是神 只要有失誤就會輸
作者: arnold3 (no)   2016-03-11 15:59:00
電腦每一步大概都只有5成多把握而已 強就強再不會失常而
作者: wen17 (祭祀風的人類)   2016-03-11 15:59:00
以上優劣說的是局部可以算出絕對優劣的地方.
作者: arnold3 (no)   2016-03-11 16:00:00
來個天才型的高手把把都出妙手 電腦自然越下勝率越低不需要跟電腦拼計算 用大局意識跟電腦玩
作者: ggoutoutder (女朋友的左手)   2016-03-11 16:02:00
真的很多不懂圍棋的在那邊自以為 連叫吃是什麼都不知
作者: liaon98 (liaon98)   2016-03-11 16:05:00
電腦後面盤面越窄 精確率會越高 人類只有前期有機會
作者: aaaba (小強)   2016-03-11 16:09:00
你講的就是李喆說的,電腦欠缺邏輯論證的推理
作者: notmuchmoney (真的不錯....)   2016-03-11 16:09:00
AlphaGO大局觀還是不錯 能夠在這上面贏過AlphaGO還很難說
作者: Max11 (從來沒有)   2016-03-11 16:10:00
職業棋士的比賽,如果最後靠對方犯錯獲勝,那也不是值得記錄的名局。本來圍棋的勝負就是要全部都是合理應手。
作者: tomic (細推物理須行樂)   2016-03-11 16:12:00
推 中肯!
作者: AmuroRay (聯邦の白き流星)   2016-03-11 16:15:00
沒人在懷疑你說的那些地方AG有問題 關鍵是中前盤看似不1好的棋到底有沒有不好 另外一方面 李喆也推測 這種邏輯上就證明不好的選擇 可能隨著局勢越緊張接近而越少會作出
作者: wen17 (祭祀風的人類)   2016-03-11 16:17:00
多賺一目的價值會隨著局勢僵持緊張甚至劣勢=而變大而之後需要負擔的計算複雜度(風險)是固定的
作者: shellpig (貝殼)   2016-03-11 16:18:00
其實我覺得現在很大一個點就是,人類覺得的好壞,似乎
作者: sky0302 (free)   2016-03-11 16:18:00
問題就是當電腦在布局下出怪手 小李並沒有去反擊
作者: wen17 (祭祀風的人類)   2016-03-11 16:18:00
所以說夠僵持的時候"推測"可能就不會出這些看起來有問題的
作者: tonyselina (叫聲拔拔)   2016-03-11 16:19:00
你第一行哪來的? 幾乎沒人這樣講
作者: notmuchmoney (真的不錯....)   2016-03-11 16:19:00
如果前兩盤是針對AlphaGO可能的弱點 而下出有別以往的策略/棋風 那在0:2下 後三盤我也認為該回到合理的應手
作者: sky0302 (free)   2016-03-11 16:19:00
所以根本也無法說那些是好棋 反正人類還是不會學電腦的棋
作者: goldduck (哥達鴨)   2016-03-11 16:19:00
好棋是慢慢累積的 壞棋是後面無法挽回的
作者: wen17 (祭祀風的人類)   2016-03-11 16:19:00
我不算懂圍棋 只看了柯直播柯一直說李下的很怪 不像平常的李會扯到劫也是說打劫去拼九死一生不打劫去拼十死無生 只是局面不會整個崩這樣輸
作者: chordate (封侯事在)   2016-03-11 16:21:00
問個白癡問題,AlphaGo的型不好那麼顯而易見
作者: wen17 (祭祀風的人類)   2016-03-11 16:21:00
然而李沒打劫 所以柯一直覺得很奇怪
作者: liaon98 (liaon98)   2016-03-11 16:21:00
那時李也沒時間了 在讀秒
作者: wen17 (祭祀風的人類)   2016-03-11 16:22:00
昨天是有提到有部分是局部優劣 可以直接"計算"比較
作者: shellpig (貝殼)   2016-03-11 16:22:00
AG下的手法也超出預期呀,不是說用往常下法就一定好
作者: chordate (封侯事在)   2016-03-11 16:22:00
那為什麼李會連出緩手讓優勢就這樣溜掉了?
作者: goldduck (哥達鴨)   2016-03-11 16:22:00
型不是重點 問題是型爛你都贏不了啊
作者: wen17 (祭祀風的人類)   2016-03-11 16:23:00
而全局的子後面柯也沒說afgo下錯 頂多說值得討論
作者: liaon98 (liaon98)   2016-03-11 16:23:00
ch 大 人類不是機器 犯錯不是很正常嗎XD 況解比賽壓力這麼大還要讀秒限時
作者: arnold3 (no)   2016-03-11 16:25:00
拓海一開始跟車也只是讓人覺得還算會開 哪知道最後甩不掉最重要還是自己被逼到超時壓力大被超過去
作者: sck921 (The Fate)   2016-03-11 16:26:00
有人就說電腦算到終盤了阿 XD
作者: chordate (封侯事在)   2016-03-11 16:26:00
感謝回答,所以現在職業棋手的見解是這盤兩邊都犯錯太多,不能算是名留歷史的一盤棋嗎?
作者: shyangs (厚呦)   2016-03-11 16:28:00
來個二日制,柯可以無限call out各研究室
作者: liaon98 (liaon98)   2016-03-11 16:28:00
第一盤應該歷史意義比較大吧
作者: hdjj (hdjj)   2016-03-11 16:28:00
下了一整盤好棋結果緊要關頭下出一手臭棋,結果還是會輸
作者: shyangs (厚呦)   2016-03-11 16:29:00
這樣才能下出接近人類最高水準的棋
作者: aaaba (小強)   2016-03-11 16:30:00
兩日制你打卦,隔天就輸飛了
作者: notmuchmoney (真的不錯....)   2016-03-11 16:32:00
一些話如"捍衛人類尊嚴"都說出來了 恐怕應該考慮合乎過去棋理的應手
作者: shyangs (厚呦)   2016-03-11 16:32:00
分佈式擴大硬體規模,和打卦的時間,意義是一樣的
作者: notmuchmoney (真的不錯....)   2016-03-11 16:34:00
手機手殘按到噓 抱歉推回
作者: Ebergies (火神)   2016-03-11 16:35:00
往四路壓不會讓 AG 的中央有更強的勢力嗎?昨天壓五最後右邊也還是白子的地吧
作者: darkseer   2016-03-11 16:41:00
我不太懂Monte Carlo搜尋,不過AlphaGo的機率應該不是直覺意義上的機率,比較像是因為無法窮盡變化而做的估計
作者: liaon98 (liaon98)   2016-03-11 16:43:00
白64古力也是說白棋擠在一團沒效率 是緩著
作者: ilw4e (可以吃嗎?)   2016-03-11 16:43:00
我知道背後機率沒那麼簡單:D 只是說勝率最高不見得是最佳解而這個遊戲是有最佳解的(如果有圍棋之神窮舉法:D)
作者: AmuroRay (聯邦の白き流星)   2016-03-11 16:45:00
這遊戲或許有最佳解 但其實過去長久累積的觀念所追求的說到底也是勝率最高的解 而未必是最佳解
作者: darkseer   2016-03-11 16:46:00
我班門弄斧了XD 我是猜測他應該是很有效率的逼近邏輯
作者: marrvosal (神清水)   2016-03-11 16:46:00
反了,是我下這手勝率有多高,而非對手下這手勝率多高
作者: darkseer   2016-03-11 16:47:00
只是人知道要局部考慮,AG不知道,所以在局部上AG有弱點
作者: marrvosal (神清水)   2016-03-11 16:47:00
而且實際上蒙地卡羅不會只搜一層random算而是在允許的時間內多算幾層,所以唯一解他還是會看到所以電腦會去搜尋下z之後的勝率,會發現這步勝率很高因此電腦會避免讓對手下z。
作者: chordate (封侯事在)   2016-03-11 16:56:00
謝謝回答
作者: vvrr (vvrr)   2016-03-11 16:57:00
我不認為它會對必勝必敗的點做排除。基本上就是對全局找一個勝率高的解。攻殺不會出錯是因為他把後面變化都看過了
作者: shellpig (貝殼)   2016-03-11 17:00:00
能算出來必敗的點可以排除吧,現在是算不完所以例如本文中第二段那種案例,阿發狗不會下的
作者: birdy590 (Birdy)   2016-03-11 17:01:00
每個可能的選擇會有一個分數, 分數會由該分支往下算所以如果接下來有很大的可能虧損, 分數上自然會被排除有件事大概可以肯定, 就是"AG不會做出虧損太大的選擇"
作者: shellpig (貝殼)   2016-03-11 17:02:00
甚至可思考為,在可接受時間內,算出95%的後續變化都能贏
作者: kafai (豬仔包 PigSonBow)   2016-03-11 17:02:00
那算路超深的妙手應該是不一定算得出,小手筋還可以
作者: ilw4e (可以吃嗎?)   2016-03-11 17:03:00
但必須給對方正解的那node特別高的權重電腦才知道不能下吧
作者: birdy590 (Birdy)   2016-03-11 17:03:00
因為 AG 根本只是在計算 它上不知道自己正在下圍棋
作者: shellpig (貝殼)   2016-03-11 17:03:00
剩下的絕對不夠時間算不完,那就這樣子下了
作者: birdy590 (Birdy)   2016-03-11 17:04:00
事實也證明 棋評認為是臭手的 並無法從中獲得太多利益
作者: marrvosal (神清水)   2016-03-11 17:05:00
蒙地卡羅有點難講清楚,但是電腦在這塊不太會出錯
作者: birdy590 (Birdy)   2016-03-11 17:06:00
第三段的假設是沒錯 但是好像要在貓脖子上掛鈴鐺一樣想在早期靠"不是很好的著手"取得利益, 本身也很難做到AlphaGo 當然不是無敵, 單機都還是可以擊敗分散式了
作者: marrvosal (神清水)   2016-03-11 17:08:00
樓上,當然,alphaGo還沒有train到最好就算train到最好,也不一定能到圍棋之神的實力
作者: birdy590 (Birdy)   2016-03-11 17:11:00
問題是要壓過人類 實力不需要到圍棋之神啊 @@
作者: marrvosal (神清水)   2016-03-11 17:14:00
是的。
作者: birdy590 (Birdy)   2016-03-11 17:16:00
所以單機和分散對下是不錯的指標, 愈靠近 100%, 就知道實力愈強了
作者: marrvosal (神清水)   2016-03-11 17:17:00
實際上alphaGO進步的地方並非單機跟離散離散勝率高只是因為它算得比較快,可以多算一點alphaGO進步的話則是在算之前的候選挑選進步要知道實力有沒有變強應該是用新版的跟舊版的比較
作者: birdy590 (Birdy)   2016-03-11 17:20:00
理論上算的愈深愈有機會找到更佳解 新舊只差在訓練分散式勝率提高代表運算加深以後正確率有提高
作者: marrvosal (神清水)   2016-03-11 17:23:00
alphaGO的重點就在訓練,搜尋多深都只是硬體的問題我甚至認為,當train的越好,單機的勝率會提升
作者: birdy590 (Birdy)   2016-03-11 17:26:00
單機或分散 兩邊都 train 過一樣的東西啊 /_\分散能找到更多確實更好的選擇 才是代表訓練成功不是嗎?
作者: marrvosal (神清水)   2016-03-11 17:27:00
找到好的選擇這件是對單機跟分散是一樣的差別在於分散從好的選擇裡面挑出最好的會更好所以如果deep learning 已經好到幫你挑的非常好那你其實不太需要運算量就能選出最好的那步此時就不太需要分散運算
作者: birdy590 (Birdy)   2016-03-11 17:29:00
我覺得在前中段講這個沒啥可能耶 後段則已經是公認的強
作者: Verola (sometimes I love you)   2016-03-11 20:46:00
同marrvosal 覺得單機勝率越高才表示成長 克服了運算速度
作者: RoundKick (我是56我最屌)   2016-03-11 20:49:00
你的解釋一日棋迷看的懂才有鬼 有的話樓下幫我吹
作者: NaoGaTsu (那歐卡茲)   2016-03-11 21:42:00
marrvosal的解釋完全正確。
作者: Palpatineli (Chancellor)   2016-03-11 22:37:00
我這種只上過AI intro的人都看得出來你講什麼胡話。蒙地卡羅基於的本來就是最大最小樹。維基一下最大最小樹就完全解答你這篇的外行問題了。
作者: ilw4e (可以吃嗎?)   2016-03-12 00:25:00
哥沒上過AI intro,你可以在板上開課,請https://en.wikipedia.org/wiki/Computer_Go這裡就有說會有我提的疑問了,加入minimax可以理解,但那是game theory的東西跟monte carlo tree不是直接關係,謝謝總之就是加一個選擇最好的最差解的判別來濾掉必敗局面
作者: darkseer   2016-03-12 02:40:00
我還是覺得不是,Monte Carlo tree search理論上會收斂到minimax,我猜測這裡也是類似的原理:自己和對方的好手在MC tree裏頭會走得特別深。如果對『好手』的判斷夠準就可以避免你說的問題。我也不知道我說的對不對,marrvosal要不要發一篇教學XD

Links booklink

Contact Us: admin [ a t ] ucptt.com