Re: [情報] Alphago新的自戰對局 ilw4e PTT批踢踢實業坊

Re: [情報] Alphago新的自戰對局

作者: ilw4e (可以吃嗎？) 2017-05-27 23:07:55

※ 引述《HeterCompute (異質運算)》之銘言：
: https://deepmind.com/research/alphago/alphago-vs-alphago-self-play-games/
: AlphaGo說每天都會更新10盤新的自我對戰。
: PS:一開始點進去第一盤好像會有bug不能按，
: 要看的話請自己點一下其它盤再點回來第一盤。
: PS2:10盤有8盤黑棋爆炸，看來貼目7.5太多了XD
看野狐職棋講前三盤，大致就是一直說看不懂:D
如果說真要從AI學些甚麼，大概主要在佈局階段吧。模擬出來的結果
讓人知道不同佈局下哪邊才是最大的大場。
用這角度思考很好理解為什麼AI通常不會把人類定石下完，因為定石
的每步交換都是只看"區域"的兩分而較少考慮全局，而每步價值可能
是遞減的，比方說佔空角可能價值20目，掛角可能值15目，再下一步
可能只剩10目，所以AI可能掛完就手拔了，因為外面有更大的點(AI
理解為勝率更高)
再來就是不同局面下先手價值多大或甚麼時候可以手拔也是可以跟AI
學習判斷的。不管AI互下或跟人下的譜常常就是一直手拔，有時做些
區域被認為損目的交換就是為了搶先手。這次覺得柯潔很厲害的點就
是三盤似乎都不像上次李世石那麼被動，他很努力在各種情勢中設法
脫先，避免局勢完全被電腦帶著走，但可惜實力有差距
想想真要對人類學棋更有意義的話可能還是要人類和AI對弈。從AI邏
輯來想，他的勝負手或官子都和人類理解的最佳下法有差異，而且對
人下棋的邏輯來說是沒甚麼幫助的。比方說收官吧，人類落後時仍會
下最佳解(最大官子)等待機會，但對AI來說他早就預見這樣收必敗，
勝率很低。所以AI互下時落後方AI的選點可能是人類一看明顯沒棋又
損目的送菜(對AI來說送菜的點可能他模擬時才有勝機)，而領先方AI
可能判斷大優勢所以一直退讓也一樣在損目，這種時候兩邊都不是下
最佳解，那自然就不一定值得學
這次放出的AI對奕譜大概都是挑過的，猜測應該都是挑選全盤兩方估
計勝率維持相近或是有勝率倒轉的才較有可看性。不然很多AI對奕的
譜應該是一面倒，落後方不斷用無理手測試然後越虧越多勝率不斷被
拉開後投子

作者: aegis43210 (宇宙) 2017-05-27 23:10:00

意思就是對手愈強，展現出來的棋譜素質也就愈高但十盤棋譜素質高到幾乎沒有棋手懂，棋感差太多了

作者: HeterCompute (異質運算) 2017-05-27 23:16:00

我的看法跟你不一樣序盤也沒辦法學AI，因為你不知道他後續的下法，學都無從學起，只能說境界真的差太多

作者: LeeSeDol (嘖嘖...) 2017-05-27 23:18:00

如果明後年的佈局跟今天差異很大，新手新型超多，算不算學到？

作者: toya123 (雷姆在我床上閉嘴) 2017-05-27 23:20:00

能學是必然的只是能學得而且能夠理解應該是少數中的少數就跟人一樣每個人出生就有差異了總有幾個人是特別能夠對圖形理解分析較強而且計算能力好的不過這樣的人大多不是在玩圍棋罷了

作者: sadmonkey (下雨天) 2017-05-27 23:23:00

AG每天下成千上萬盤棋要怎麼挑？最多就是讓黃博士針對

作者: HeterCompute (異質運算) 2017-05-27 23:23:00

每個定石都是好幾十個變化然後妥協出來的，要改變就是要把他一整套學起來，不然你只模仿他那一步，別人

作者: chris610020 (å¯æ‚²çš„é˜¿æ˜Ž) 2017-05-27 23:24:00

這就好像人剛剛發現日心說，AI突然丟個相對論出來^類

作者: HeterCompute (異質運算) 2017-05-27 23:24:00

隨便變招，你根本不會用，更不要說他那千變萬化的手拔

作者: sadmonkey (下雨天) 2017-05-27 23:24:00

不同開局前幾步大概選一下，更有可能就是隨機選出來

作者: HeterCompute (異質運算) 2017-05-27 23:25:00

樓上比喻正確，連微積分都不會，根本看不懂相對論怎麼回事還有很重要的一點是，黑棋現在很明顯是貼目過重如果沒有勝率表，你根本不知道AG現在到底是在拼命還

作者: sadmonkey (下雨天) 2017-05-27 23:26:00

去年古力賽後有幫AG三盤自我對戰快棋來探討，當時就已

作者: HeterCompute (異質運算) 2017-05-27 23:26:00

是在下本手，搞不好他只是想試試看，你拿去照抄根本

作者: sadmonkey (下雨天) 2017-05-27 23:27:00

經有些招法看不太懂或是需要耗費大量時間才能解讀

作者: HeterCompute (異質運算) 2017-05-27 23:27:00

東施效顰

作者: sadmonkey (下雨天) 2017-05-27 23:28:00

基本上這五十盤就像無字天書一樣，是拿來供不是拿來用

作者: toya123 (雷姆在我床上閉嘴) 2017-05-27 23:29:00

很多佈局跟套路也是我們照著古人的下法發展出自己的下法要說完全沒用到不至於棋手原本就是要多下才有棋感只是你要完全吃透才用那才是不可能的事情都沒試怎麼知道如何最適合的運用方式

作者: HeterCompute (異質運算) 2017-05-27 23:45:00

是啊，是重複出現，代表一定有理論可以解釋他，只是境界差太多，真的不知道從何學起回t大，你不吃透到一定程度，就如同邯鄲學步，沒下個數個月，根本不敢拿出來下

作者: ilw4e (可以吃嗎？) 2017-05-27 23:49:00

其實圍棋原本就這樣阿，流行佈局或下法不是都高段開始下，

作者: toya123 (雷姆在我床上閉嘴) 2017-05-27 23:49:00

這麼跟你說好了就棋手而言你要完全的理解阿法狗是不太

作者: toya123 (雷姆在我床上閉嘴) 2017-05-27 23:50:00

可能的事但是就部分的套路來講可能有人了解了阿法狗的佈局有的人了解他的部分套路當這些人拿著這些新套路或新佈局交手經過了很多棋局就發展出我們認定的新的棋理從以前到現在都是如此我們原本的學習就是從模仿棋譜開始以前可以這樣學習到現在也是可以的

作者: walkwall (會走路的牆) 2017-05-27 23:55:00

如果AG真的20級硬要講解就類似初學者講解高手對戰一樣所以最可能講解的理應是棋力最高的人或其他AI

作者: ilw4e (可以吃嗎？) 2017-05-27 23:58:00

摸透本來就是高段的事啊，就像業餘的去看職業譜常常也是記套路，幾個敢說真的搞懂全部變化？:D

作者: Uizmp (黑袍法師) 2017-05-28 00:00:00

所以柯潔能和Deepmind人員聯合探討這三盤棋應該很有價值

作者: LeeSeDol (嘖嘖...) 2017-05-28 00:00:00

所以到底要不要講解、要不要研究，如果答案是要，那我真的不了解先篤定說學不來的用意是什麼？又不是要學到能贏alphago，只要用這些招能讓勝率提高，那就夠了

作者: ilw4e (可以吃嗎？) 2017-05-28 00:01:00

就是能理解到為什麼這樣下勝率可能高就好，如果自己試發現勝率反而更低那就果斷放棄就好XD

作者: HeterCompute (異質運算) 2017-05-28 00:02:00

當然要講解要研究啊，只是你看小目二尖高跳還是沒什麼人下，等到數年之後，大家都摸個大概之後，傳到我們業餘也大概明白之後，就是大家都下的時候啦只是現在alphago如果什麼都不跟你交流，你自己摸真的什麼也不懂啊

作者: ilw4e (可以吃嗎？) 2017-05-28 00:03:00

就像柯潔最近一直下三三一定也研究過覺得那樣應該不虧阿

作者: walkwall (會走路的牆) 2017-05-28 00:04:00

其實機器學習也有一個新方向是追求模型的"解釋能力"

作者: HeterCompute (異質運算) 2017-05-28 00:04:00

因為三三好理解啊，但是小目二尖高跳怎麼理解？

作者: LeeSeDol (嘖嘖...) 2017-05-28 00:05:00

論文公佈後應該會有十個版本的偽物，別擔心沒得印證

作者: walkwall (會走路的牆) 2017-05-28 00:05:00

所以未來AI往"能講解" 這方向發展也是有可能的

作者: CGary (下雨天也挺浪漫的) 2017-05-28 03:43:00

我本來以為DM會把這整塊Open source, 結果只是發布論文...有點意外就是了

作者: sethero5 (羅莉仔) 2017-05-28 06:15:00

因為阿發狗的程式是可以變化後套用在其他領域的，谷歌不太可能釋出嚷大家抄。

作者: letudiant 2017-05-28 07:22:00

小目二間高跳常常可以用小目二間高掛來手割比起其它的一些新手可能算還好吧

作者: jpwd (jpwd) 2017-05-28 08:21:00

只能當棋譜是太玄神經了，懂圍棋的反而看不懂。

作者: aegis43210 (宇宙) 2017-05-28 17:18:00

所以現在能瞭解google和deepmind的苦心和決斷力他們不辦這個人機大戰2.0，讓全世界看到現在的alphago已經無懈可擊、近乎完美，全世界會認同alphago嗎？會認同這些乍看之下完全無法理解的自戰棋譜嗎？

作者: ilw4e (可以吃嗎？) 2017-05-28 17:28:00

早就認同了吧，去年Master那60盤就知道差距了

繼續閱讀

[問題] 想請問一下古力連笑混雙中的這一手?et220870 [新聞] 專訪柯潔：與AlphaGo對局很痛苦流淚因winall Re: [影片] Alphago人機三戰講評q6261901 [討論] 雖有Alphago棋譜，但沒Alphago很難印證吧zkow [影片] Alphago人機三戰講評coolbetter33 [討論] 柯潔後天就要比LG盃了，會大勝還大敗呢？zkow [新聞] 新華社曝柯潔賽場失聲痛哭棋局停滯20分鐘zkow [新聞] 柯潔完敗後落淚：AlphaGo太完美我看不到MonkeyCL [新聞] 打遍天下已無敵手研發團隊宣布AlphaGo退winall [情報] Alphago新的自戰對局HeterCompute