[討論] Google DeepMind - AlphaGo vs 樊麾 wukevinboy PTT批踢踢實業坊

[討論] Google DeepMind - AlphaGo vs 樊麾

作者: wukevinboy (wukevinboy) 2016-01-28 18:50:39

先說說我個人看法，我覺得這軟體水平在弈城八段左右。
真要說他有沒有九段，我個人覺得應該沒有。
另外說說中國水平弈城九段的棋友對這軟體的評價，
裡面有幾位是中國強業五，業六，已定段朋友的群組評論。
假棋、花了多少錢、我讓兩個試試等等的..... XDDD 當然有點逗了
接下來是我自己對棋譜的理解，因為很久沒下了，所以我得棋力已經不太ok了，
都是我個人的評論，如果有錯誤請指正～
對於這次如果你認為這是圍棋軟體實力大幅提升，我認為這是很正確的觀點，
但如果你認為這是圍棋軟體已經達到職業水平，可以完封歐洲圍棋冠軍，那麼
...你可能要先看過棋譜 XD ？不要太過於相信新聞，現在這位測試者我認為頂
多中國業五，台灣強業六水平。
第一譜
http://lgs.tw/qoesav1
截至第十手，白棋都是很正常的布局定型，黑29手感覺很奇怪，感覺應該一間
低夾來定型，或者是說更前面白掛就該採取夾擊，讓白20手成孤棋，但黑棋居
然讓白棋簡單拆二定型，感覺白棋20手的逼也是賺了一著，黑棋31的小飛位置
，以布局來說我覺得應該下O3，但是黑棋居然拆扁的位置...實在很怪。34拆
二感覺是緩著，35尖反而剛剛好黑棋補好...後面的走法可能不一定是好的，
但是...我覺得可能有更好的走法，但對業餘來說我覺得還算在可以接受的範
圍內吧？
57和58的交換，我個人感覺57有點問題。63和65的走法，個人感覺是在幫白棋
賺實地，所以感覺得出黑棋根本沒想要贏的感覺。75、77狂賣劫材，不太懂為
什麼要走。85為何不直接87單補也是讓我覺得很怪異。白88的虎黑棋居然直接
接著，以子效來說絕對是往中央跳一個之類的，而不是單接。
105和106交換明顯很怪異，真要下的話，為什麼不106再下拖一個或者單接？打
到這裡我看一些弈城中九，大陸強業五、六，對這軟體的評價是讓兩個，有人
甚至說臭到不忍直視.....121還是覺得可以往更裡面跳一點，不知道有沒有更
深入的走法，到146黑棋121的問題就體現出來了，因為中央也成了一定的空...
後面的收空也就不看了...
補充：130這手棋，對局者本身說是忽略了，然而我認為這手棋確實是體現出了
電腦的水平。
第二譜
http://lgs.tw/q9qw5f7
好，前面雪崩我就不檢討了，打算開實況在檢討，這種棋如果要檢討實在
太麻煩...另外這定型我也覺得很詭異.....因為完全不按譜的...走完這
串到40手我認為是白棋好下的局面。然而44的長是否該改成跳有待討論，
比較不理解的是，46推了48又衝了，如果沒有很好的手段，48手就是俗手
，而走了幾手後，看起來就是白棋誤算...或者根本打算出錯，根據前面
幾譜我基本上覺得這棋是不是有"正常"下已經可議了。
而後續我們看了一下，這棋白棋並沒有特別好的手段，而白62力挽狂瀾，
想要彌補錯誤，靠了一下貌似騰挪好手，但後續被吃掉後，雖然白棋中腹
有巨大的潛力，但我覺得還是被吃太多了。86手是厚實的一手可以理解，
而後續黑87掛白88飛貌似也不是很好的一著。雖然黑棋走得很爛基本上幫
白棋走成好型，走到115白棋右下莫名其妙的，原本不好定型的棋卻變成
成功的定型...實在讓人詫異。
116~120是想要把中腹都變成姓白的，而122的靠適應手，整個活掉我認為
白棋適應手算是成功的，後來仔細看一下黑棋可以吃白棋，不吃的原因，
很可能是電腦判斷覺得已經贏了，然而白棋想要硬撐著圍住中腹，我認為
實在有點不切實際，但我比較好奇的是165白棋真的只能乖乖應嗎？很想尖
N11，如果成立那黑棋不是要全死在裡面了...而我這部分打算都丟到開實
況來研究，看一下是否必須應的。到最後如果166必須應，白棋基本上已經
無法扭轉局面了。
補充：166感覺是沒有什麼機會不補，看起來白棋白穿入後沒有特別好的
辦法應對，來扭轉局面了。
第三譜
http://lgs.tw/q4ioppv
這是我覺得挺莫名其妙的一譜，和第五譜前面一樣的雙掛一樣的詭異定型
，都讓我覺得電腦對於這局部的定型不太熟悉，因為18手有點怪怪的，可
以說是臭棋吧，通常18手應該是下在20單跳的位置，所以造成詭異定型。
當然這定型我也不太了解，但我不太會去走我不太熟悉的套路。這次的定
型我覺得黑棋定型定的比第五譜好，到36手我覺得黑不差，因為白中央不
知道在幹嘛..至於後面白棋幫黑棋圍空，如果是我的話我會想要執黑，但
也不一定就是黑好了。因為F9也有一定的"隱患"在。而後續白52打入攪亂
局面我認為是可行的一著。但對於白60板了一下，黑居然去下61，真的不
能理解，先不說白上面有沒有機會活了，就算沒有機會活，也留下了成千
上萬個劫材...，61的走法不能理解。64終於開始對黑棋動刀了，這也是
我說走到51我覺得 55波，我偏好黑一點，but還是有一定的隱患在。之後
黑棋跑兩子越跑越重，不能理解。如果我來下可能就左下角孬補一手算了
。實戰黑棋的走法相當於把自己逼像絕路。
黑棋67的丁主要想要刺白棋的點方位置，喵著斷點，但是白68好手黑棋自
己本身也是氣緊的狀況，所以白棋的攻擊黑明顯不好。不得不說白68手。
展現了這款圍棋 AI 具有相當的實力。白棋80手的丁，體現出了圍棋AI的
敏銳度，這盤棋可以說是圍棋 AI 真的讓我可以接受他是目前我看過最強
AI的原因了，不得不說80手的走法很犀利。但黑棋的走法就顯得很悲哀了
，從原本我認為還不錯，搞到兩邊不活。
92手補一手，可能是想要殺黑棋的手段，但是不太能理解黑棋93手，不知
道是不是沒有意識到白92手，讓他少了眼位的狀況。黑原本有做眼且阻度
的手段，但白92自補一手後，黑棋卻沒有招了，93手飛可能是不得已，可
能是漏算左邊的狀況，詳細是什麼就不清楚了。走到這裡黑棋已經崩盤。
97、99手的掛法，讓人覺得這黑棋真的會下棋嗎...還是已經自暴自棄？
後面111手的靠白棋的板起，後續走到118白棋還能接受。但是124的走
法讓我覺得無法了解，感覺不如單飛一手算了。幫黑棋全圍上，後續132
的接又落後手。145完全看不懂，理當下在146補上也就是了。最後讓白
棋又衝來殺去的。被154打了三子後，黑棋基本上不行了。
第四譜
http://lgs.tw/q2fccid
至20，我覺得這些布局都是個人喜好，沒有什麼太過於大的問題，當然
如果要說小問題，那肯定還是有的，只是我在這裡就不檢討這些，因為
我對於一些比較細微的問題我常常自己也搞不清楚，黑 21、23是常用的
連環拳，但是白24顯得奇怪從某種層面來說，我個人認為是在幫黑棋加
厚，到31黑棋明顯舒暢，白棋沒活，還要逃亡也沒辦法對黑棋左邊空上
有任何的威脅，相反的因為自己本身薄弱，所以造成黑棋有機會兩邊圍
到，33後續的走法意圖分斷白棋，到這裡我覺得這白棋布局明顯的有問
題，而黑棋走道45後，我個人認為可以47可以考慮飛 H18直接把對方全
數殲滅，當然這是我個人的觀點，有點暴力也不一定成立，不過47走一
下也是可以接受因為我個人認為這黑棋已經大優了。
49立下，變成白棋兩塊沒活，即使活了也很可能是大家所謂的兩眼，或
者是苦活，到這裡白棋布局我覺得完全是失敗的，至於問題可能要歸於
24手的疑問手。走到64，白棋雖然兩塊都算是暫無死亡的可能性，但也
已經算是有點潰敗的感覺了，黑棋中央的厚勢，左邊的成空，都有一定
的目數，而反觀白棋上邊的目數較扁，下方的目數又顯得很不扎實。
從65~70的交換，我們可以看出電腦對於劫材的敏銳度，很明顯的並不高
，所以真要說這電腦有什麼大問題，劫材判斷還是有點問題的，75的打入
白棋的應對方式竟然是先尖了，和黑棋77交換，這明顯是幫對方補厚的走
法，相信有一定水平的棋友都知道，這種先虛刺的棋並不可取，在一些特
殊情況下才可以成立，但在這裡我並不認為這手是必要的。79我們又再次
看出電腦圍棋對於劫材的敏銳度很差，這樣的著手說要到達職業我個人認
為真的是太誇張了，而後續對於黑棋81的打入，我認為應該有更好的著手
實戰黑棋整個先手撈掉上邊甚至角空，很明顯的白棋應對大失敗。
黑棋99打入應該"可能"是全局最大的一手，然而白100手踢，是否是好的
應對我個人認為有待商討，我更傾向於上面飛鎮攻擊，因為白右邊的角
很厚實，而102飛一個黑棋立即點入，白棋以下的應對真的沒有職業棋士
的水平，黑棋竟然就在白棋的根據地中打出一塊安定的活棋雖然白棋進
角了，但邊上的損失確實是太大了點。然而這時候黑棋117是我一直很有
疑問的一手，如果給白棋來下板過去是成立的，為什麼白一直不板掉，
我前面的可能是最大的一手，特別加上了雙引號，意思就是那手棋如果
直接板吃掉，可能更大一點。而且對白棋整塊厚味也有加強的效果，現
在117被黑棋補上，白棋上方極有可能變成龍。
後續黑棋白棋走了幾手，到128、130我真的覺得這種局面下還要苦活，
我大概已經沒辦法接受了吧？可能是我我就投了。黑131飛到，基本上
可以宣告白棋輸掉了。幾乎沒有地中腹又幾乎全姓黑了。後續134的刺
我個人認為，黑棋完全可以 L6 二間跳一個。簡單圍上也可以了，奇
怪的是後面白棋居然又出了棋，以職棋來說打這種勺子實在有點驚人。
第五譜
http://lgs.tw/qsgqyc0
到第八手都是很正常的迷你中國流，16雙飛燕是必然，後續走法我也有點忘了
但是實戰黑棋明顯放水，17手算是正常走法，但18手 google 點入看似撈空的
好手段但實則不然，應該單跳20手的位置。詳細走法實況聊～因為我也不是很
確定怎麼走XD？
31飛一手貌似是必然的一手，因為沒下黑好像棋型也是薄弱，所以我認為必走
，原因是31走了可以加強自己，然而33長，按理來說應該是後手了，白棋AI又
去跳一手，以我的判斷應該在上面黑棋大空打入一手調一調之類的。34會去應
可能是擔心黑棋，B5尖一下有虎過去的手段，所以 H3 拐會成為先手拐。
38打入感覺上是過硬的，我可能沒這種把握，因為有點過於深入，40手直接板
底下，不太了解但如果用長的，可能確實會遭到一陣猛攻，然而不管怎樣我個
人在這裡會偏好消多少是多少不會去板二路，因為被黑棋虎上面有點不能接受
，這樣反而黑棋走在外面白棋走在裡面，白棋顯得小了。
53手55手走法更是讓人不得不質疑這是假棋，試想53手後接續的55手有走到空
嗎？我個人認為沒有，如果單純53手我覺得可以考慮，但53後55實在沒空怪異
如果是我我更傾向於掛右下角，白棋虎一個是可以理解的因為不虎，黑棋連一
手有一定價值還是先手，然而黑55竟然跟著應了，我個人更傾向於直接全部連
厚吧？另外上面我覺得53手也可以考慮去補後上邊，後來也被白棋動出了。
56拐出，黑棋退一個，可能是必須的，但感覺也可以板起，緊著白棋的氣，而
後續白棋的靠，和64得靠看起來是很有手段的組合拳，實則不然，我完全不明
白為什麼黑65要長讓白66擋下，照理來說 65=66是可以擋住白棋的，白棋貌似
沒有什麼手段，67也是無法理解，為什麼要讓白棋吃的這麼乾淨，所以這盤棋
的真實性實在讓人懷疑。69也是怪著，為何不貼在70位，到這裡基本上有一定
水平的棋友可能已經開始懷疑這所謂電腦超越職業的真實性了，從我和一些水
平可能已經在職業朋友的觀點來看，這棋是否是假棋，是噱頭還是真的這職業
太久沒下，所以下成這樣，我個人認為台灣每位職業棋手都不會輸給這軟體。
75打了後手，然而全盤我認為最大的掛角一直沒有人走，實在是很詭異。78的
衝根本是自殺性的一手棋，而後續黑棋走法截至91手我認為都沒有太大的問題
，93手讓人質疑，感覺士單官揮了一手棋，如果是我來下我應該會直接擋在94
，對目數有一定幫助之外，我中央也不用再跑，如果要走93那必須是我很有把
握把中央白棋那一團殺死，不然93我不會直接走，太過於冒險，從後面來看要
殺白棋並不是特別容易，雖然我覺得後面攻擊黑棋頗有收穫，但121黑棋的打
吃實在有點問題，如果我來下白棋應該不會尖回，而是直接板 K13，然後虎一
個之後連二子和斷黑四子二選一。
右下角的打劫讓人覺得奇怪，轉換後感覺黑棋也沒賺到...主要是後面的走法太
奇怪到這裡這盤解到這裡差不多了，主要是感覺黑棋很多緩著，甚至很多不可
理解的走法，讓人質疑了這次比賽的真實性。
附上一些最近圍棋 AI 相關的新聞 & 連結
Google Deepmind
http://www.deepmind.com/alpha-go.html
iThome
http://www.ithome.com.tw/news/103607
Mark Zuckerberg (臉書創辦人)
https://goo.gl/6oYULI
以上是最近關於圍棋 AI 的新聞，大家可以參考一下。
圍棋 AI ，我對於目前的實力確實有點震驚，但是如果說它因為這次的比賽，
而讓大家認為已經具備打敗職業棋士實力，我個人是完全無法認同的。
如果對於這篇討論文，有什麼錯誤的分析，麻煩留言一下，讓我在思考一下。
另外原本想開實況之類的，但因為好像碁人有專業的老師願意講解，所以我
就先丟了篇文字檔上來就好。
https://goo.gl/lMvGrK
一人一 +1，大家聽講棋XD？
最後：我聽了一點圍棋TV的對局者談話，我不得不批評，今天對於他自己本身
發揮，說了因為第一盤輸棋，心理素質已經不行了。那我認為自己本身已經稱
不上專業水平了，今天既然有勇氣說了自己是專業棋手，那就不應該出現太多
的心理問題...
而這一次的事情，確實要思考一下，當 AI 超越人類水平，大家確實要思考一
下之後的事情了。

作者: andylin8707 (新垣是我的) 2016-01-28 18:56:00

老大賺P幣不是這樣賺的阿認真推

作者: sky0302 (free) 2016-01-28 19:03:00

我看的第一盤和你的不一樣哈哈這盤我沒看到

作者: kd1523 (雨) 2016-01-28 19:08:00

超認真的文啊

作者: aaaba (小強) 2016-01-28 19:42:00

跟李世石下獎金有一百萬鎂，應氏杯才四十鎂，如果不是快棋，李應該能贏，這個電腦弱點就是超一流的訓練棋譜不夠，大部分的招法是透過中等棋手的譜訓練出來的，至於強項就是速度快，打勺的機會低。

作者: sky0302 (free) 2016-01-28 19:45:00

石頭又要狠撈一票了上次500萬人民幣這次100萬美金

作者: aaaba (小強) 2016-01-28 19:50:00

柯潔不知心裡做何感想，一百萬鎂我也想賺啊，等下次搞不好人類就賺不到了啊！

作者: sky0302 (free) 2016-01-28 20:13:00

可以看新浪棋牌的新聞普遍認為谷歌相當於業餘頂尖突然想到如果下座子棋和還棋頭不知道電腦會不會短路哈

作者: jackeikuo (逸容) 2016-01-28 20:27:00

它學了 16 萬盤 KGS 6~9 段的棋路如果把所有職業對戰譜都丟進去學不知會如何

作者: sky0302 (free) 2016-01-28 20:30:00

小米說是衝段少年李喆說是頂尖讓先倒貼柯潔評價也很高

作者: aaaba (小強) 2016-01-28 20:41:00

以現在mtcs這個AI的做法，讓子應該不影響人工智慧的發揮，因為他其中第一塊核心是計算盤面雙方贏棋的機率，這邊雙方盤面子數不一致不會造成任何問題。而另一個核心是篩選幾個可以落子的位置讓第一核心來評論勝率，再選出最好的下，這塊也跟讓不讓子關係不大。mcts

作者: sky0302 (free) 2016-01-28 20:57:00

新浪說了比賽真實性有問題但也不排除谷歌隱藏實力不過敢約戰石頭感覺善者不來來者不善當然還是看好石頭

作者: aaaba (小強) 2016-01-28 21:04:00

基本上nature期刊和google研究水平應該值得相信，至於歐陸二段的水平到哪，那是那位仁兄的問題，研究人員圖的就是他那個歐洲冠軍的頭銜，先拿下一個里程碑打響自己的名聲何樂不為。

作者: sky0302 (free) 2016-01-28 21:09:00

那個歐洲冠軍都說了私下和谷歌有協議反正到時就知道了

作者: ggoutoutder (女朋友的左手) 2016-01-28 21:09:00

小李輸一盤我就一年不尻尻

作者: aaaba (小強) 2016-01-28 21:16:00

私下協議可以理解啊，因為棋下完，paper還沒刊出啊，做研究的最怕成果被其他競爭團隊搶先發表，即便你成果再好，只要你不是第一個突破職棋障礙的，都有可能以創新元素不高而被退稿。況且是nature這個等級的期刊，如果其他團隊先發表個五戰三勝的成果，你五戰五勝再來也沒用，只能摸摸鼻子乖乖去投其他次級的小期刊吧

作者: Seikan (星函) 2016-01-28 21:28:00

開賭盤的時刻又到啦！ XD

作者: staristic (ANSI lover) 2016-01-28 21:31:00

二月底開吧，讓我好好想想要怎賭

作者: goldduck (哥達鴨) 2016-01-28 21:45:00

光是不失誤就強很多了

作者: sky0302 (free) 2016-01-28 22:03:00

所謂協議根據新浪報導是指棋的內容上反正很隱諱不過感覺谷歌有點越級打怪應該先正式比賽贏個孟泰齡之類

作者: staristic (ANSI lover) 2016-01-28 22:06:00

有看到有人猜是不能下打劫的變化，感覺這猜測有像

作者: aaaba (小強) 2016-01-28 22:22:00

我看新浪只有提到保密協議，這是要學術領域很常見的做法。至於有沒有限定可不可以打劫，我認為如果論文沒寫修改了部分遊戲規則卻暗地偷搞，是很沒道德的事，我是選擇相信作者報告成果的誠信，否則人類最高等級的學術殿堂nature豈不是淪為一本廢文集。

作者: sky0302 (free) 2016-01-28 22:29:00

三月就知道了如果出現什麼級位的失誤就對石頭太失禮了以後每年辦個谷歌杯宇宙圍棋最強人機對抗賽也不錯哈哈

作者: aaaba (小強) 2016-01-28 22:40:00

即使到時候有失誤，也無法用來否定目前戰勝歐冠的成就。即使這個歐冠對棋界而言還不算一流，但拿來當個里程碑打打廣告還是站得住腳的

作者: sky0302 (free) 2016-01-28 22:45:00

敢向石頭挑戰應該不至於有低級失誤不然像瘋石對依田下到官子變級位就很冏 = =

作者: maplefoxs (狐狸怎麼叫) 2016-01-28 22:49:00

如果不告訴我黑白分別是誰，我還以為電腦那方是職棋...這職棋的下法也太僵硬了

作者: sean51623 (千陽) 2016-01-28 22:55:00

解說不錯

作者: yyhsiu (hsiu) 2016-01-28 22:57:00

每年舉辦應該不成立…應該某一年開始電腦就會一直贏了

作者: sky0302 (free) 2016-01-28 23:04:00

若只是模仿人類那最多和人類頂尖並肩圍棋虛的地方太多

作者: tsai18 (......) 2016-01-28 23:20:00

歐洲冠軍明顯有讓太複雜的情況都盡量避開了

作者: yyhsiu (hsiu) 2016-01-28 23:23:00

或許觀念只能和人類並肩，但局佈計算力是人腦必輸的

作者: aaaba (小強) 2016-01-28 23:23:00

策略上可以模仿人類，弱一點也無妨，在計算深度與廣度上大贏，也是ai常幹的把戲

作者: yyhsiu (hsiu) 2016-01-28 23:25:00

沒錯極端來說，哪天電腦可以直接硬幹所有可能性就很確定能贏了，可能連「正確」黑棋要貼多少目都算出來了

作者: sky0302 (free) 2016-01-28 23:27:00

問題就是圍棋的局部計算是要服務全盤的下九路的電腦必勝把古往今來那些和全局有關的妙手來考電腦不認為電腦能行

作者: Rueyh (追尋永遠) 2016-01-28 23:42:00

看完覺得不如我來下吧

作者: aaaba (小強) 2016-01-28 23:44:00

你的質疑應該成立，但那應該就是因為全局有關的妙手在所有用來訓練電腦的材料中猶如滄海一粟，被大量本手所掩蓋。但別忘了這個ai可以自我精進，也就是某次他好死不死算出妙手，他就拿這著妙手來修正自己的算路(reinforcement learning)，這種技術就“有機會”讓人吃土了，那個人有辦法自己跟自己每天下幾萬盤棋，嚇死人了。

作者: ztdxqa (ztdxqa) 2016-01-29 00:25:00

可以問一下原PO弈城八的水平是多少嗎？衝段少年? 5-0 這比數實在有點懸殊意思是弈城八的網友們都可以電歐洲冠軍不知道板上有沒有職棋可以來說明一下這AI水準

作者: sky0302 (free) 2016-01-29 00:50:00

小吳應該是樂觀型棋手要我上下番棋肯定贏不了嗚嗚圍棋TV有做即時節目討論蠻多料的感覺很有趣我覺得電腦最強的還不是棋力而是穩定性的絕對心理優勢可以比做加強版的巔峰李昌鎬以前很多棋手說還沒和大李下就覺得已經輸了也就是面對電腦人類的心理負擔太大了若論絕對棋力我不相信有電腦可能能超越人腦如果有一天電腦真的一對一徹底完敗世界最頂尖那就來下加壓棋不然對人類太不公平

作者: sixersai (鍵盤華生) 2016-01-29 02:21:00

看完只覺得很假肯定有人下假棋

作者: sean51623 (千陽) 2016-01-29 02:26:00

最開始看完之後覺得電腦不太行但其實是人類沒有逼出電腦極限我覺得電腦實力究竟到哪還值得商榷

作者: jord (滅) 2016-01-29 02:59:00

看棋譜覺得電腦比我想像中的強...我應該下不贏我覺得電腦可怕的地方在於他有可能跳脫一些框架一般人則是會有很明顯的棋風與相對應的弱點業餘高段的棋其實還是犯很多錯如果電腦局部不犯錯那其實就已經很可怕了畢竟有些錯不是大局官可以彌補

作者: BigShotBob (BigShotBob) 2016-01-29 03:25:00

還沒仔細研讀論文不太知道電腦到底可以學到哪裡但沒意外的話這幾個月應該都在學職業棋士的棋譜吧@@看圍棋TV的解說去年10月他的實力水平大概在接近但未到職業的水平佈局弱中盤官子強當然這是以中國棋界的標準歐洲標準一定是職業級的了台灣標準就不確定了但不管怎麼說這個AI已經非常接近職業水準跟Zen是完全不同等級的生物啊真可怕期待三月的比賽不過不得不說這Google實在是很會廣告XD

作者: ddavid (謊言接線生) 2016-01-29 03:59:00

我沒去看其技術細節，但「好死不死算出一次妙手從此以後就修正」這回事是不是容易發生可能還得細看技術細節電腦的學習這回事其實跟人類的學習模式相差很大，相較於人類下出一次妙手就有可能一直爽爽用到被破解或被證實為止，電腦的學習除非你找很多專業棋手天天來跟它下棋，否則偶然自己下出的妙手就我淺薄的知識來說其實成功學習的難度比起人來說還是低很多當然不是說不可能，因此才說需要看細節有沒有針對這方面做設計即便有採用reinforcement learning，如果沒有特殊設計還是不容易學到偶然妙手的，特別是在它其實並不一定每次都能利用此妙手發揮價值的情況下。我可以舉個簡單的例子讓就算不懂機器學習的人也大略思考一下。比較好的情況是有天電腦下出妙手贏了（或被判斷得到優勢），因此此妙手的成功與失敗是1:0。但大量的棋譜跟自我模擬會看到很多的本手，假設某手是個60000:40000的成敗比好了。你會比較信任哪一種下法呢？那個1:0你很容易就做出各種質疑，60000:40000卻是千錘百鍊的結論。當然，人類的優勢就在於可以靠靈感、熱血或某些不理性硬是去鑽研這一手，最後發現這真的是個妙手。但電腦的運算雖快也不是無限的，它學習或選擇的優先順序還是存在的，並且往往依賴大量的數據，只出現一次的可能性在沒有特別設計或加入額外背景知識的支持下，它還是相對不容易去優先考慮學這個東西的。而且以上還是最佳情況，運氣不好時是下出了這個妙手但後續並不太會利用，結果雖然下出了好幾次卻只是個2:2甚至1:3，這反而導致更學不到的可能性也是存在的。因此如果沒有特殊的設計，其實自我學出妙手這件事的期待性並不高。呃......壞習慣又來了，不小心直接推文超過一頁......XD

作者: aaaba (小強) 2016-01-29 04:24:00

我有看論文，自我對弈後會根據勝負微量修正類神經網路的權重，中間若有妙手，大方向而言會反映在對局的結果上。而統計上這種名為SGD的優化技術會讓訓練結果更好。並非一次出現妙手就立刻學會，而是修正一點點而已。在機器學習這個領域一筆訓練樣本不會起到決定性的效用，而是反覆累計可能數以百萬計的經驗。

作者: ddavid (謊言接線生) 2016-01-29 04:31:00

我的想法是說，新的（對應於已經學得差不多的部分）妙手太少筆就會導致學不起來 + 就算靠大量自我模擬對局以亂數性使妙手更容易出現，但也無法保證後續利用成功，有可能反而埋沒妙手。我知道如果這個妙手在自我模擬大量出現，而且都利用得相對成功當然是學得到的，這沒有問題。主要是在想說除非有很特殊的設計，不然埋沒妙手的情況應該也不會是少數情況，這會導致學到某個水準以後模型收斂，無法再靠自我模擬對局再讓棋力往上，這種情況只有餵大量新的真實且更高段的對局才有機會打破這個收斂結果再次往上。

作者: aaaba (小強) 2016-01-29 04:39:00

我定義一下妙手：人類棋感(相對於alphaGo的policy network)上不會去細算卻可得利的落子位置。而mtcs演算法就是有一定機率會去算到冷門位置，假如塞到不錯的選點時，就等於偶然下出妙手。

作者: BigShotBob (BigShotBob) 2016-01-29 04:42:00

我覺得以目前這個演算法光是用打敗歐冠的AI當成pretrain model 在大量輸入職業棋手的棋譜去學習

作者: ddavid (謊言接線生) 2016-01-29 04:43:00

你有看了論文全文嗎？我只看了Abstract，就跟你說到的部分

作者: aaaba (小強) 2016-01-29 04:44:00

的確是無法無限制長棋啊，不過百尺竿頭更進一步的效果是還有的。

作者: BigShotBob (BigShotBob) 2016-01-29 04:44:00

(fine-tuning)就可以達到相當不錯的職業水平了

作者: ddavid (謊言接線生) 2016-01-29 04:45:00

差不多，其實我主要就是在想MTCS到底埋沒妙手的情況比例會

作者: BigShotBob (BigShotBob) 2016-01-29 04:46:00

當然隨機性跟那些learning rate的調配這就給最佳化專

作者: ddavid (謊言接線生) 2016-01-29 04:46:00

有多高。高到一定程度會導致前中期學習很快，感覺不斷地變

作者: ddavid (謊言接線生) 2016-01-29 04:47:00

強，但後期收斂了就不會再算出新的東西，即便MCTS也無法讓被捨棄的死去妙手重新被算回來了。

作者: BigShotBob (BigShotBob) 2016-01-29 04:48:00

擅長的左右互搏術去強化當然要到頂尖一定需要更強的演算法不過這又是一年後的事了吧抱歉截斷好多回文

作者: ddavid (謊言接線生) 2016-01-29 04:49:00

對對，我不是懷疑這個架構有往上學的能力，只是我不會認為MCTS的隨機性就足以讓這個學習有無限往上的能力，它還是會落到Local Max裡面，只是好的方法可以落到更高的Max

作者: aaaba (小強) 2016-01-29 04:52:00

同意樓上兩位的看法，每次看論文都會感嘆Google的人就是能tune出好的結果，自己就是一直鬼打牆…

作者: ddavid (謊言接線生) 2016-01-29 04:52:00

Abstract中有一句「Without any lookahead search」，這個會有一些幫助，不過這評估函數就要更精妙了XD事實上Without any lookahead search這件事正是Google的拿手好戲，用資料量壓死你，誰管什麼細節背景知識這招XD只是這邊評估函式要是只取最終勝負就一定會大量埋沒妙手，所以我想精華會在他們的優劣評估方式了

作者: aaaba (小強) 2016-01-29 05:00:00

(其實那句話是指tree search，你講的似乎是domain knowledge)

作者: BigShotBob (BigShotBob) 2016-01-29 05:01:00

看新聞google會跟韓國棋手合作感覺應該是可以拿到很多實戰經驗三月的比賽只是個起頭未來兩三年才是重點

作者: ddavid (謊言接線生) 2016-01-29 05:03:00

應該說，用背景知識去做search cut就會偏頗，所以他用完全

作者: BigShotBob (BigShotBob) 2016-01-29 05:03:00

以google的實力說不定一年就搞定＠＠當初深藍好像也

作者: aaaba (小強) 2016-01-29 05:03:00

(他即使不用mcts，效果也還不錯，但混合mcts結果更好)

作者: BigShotBob (BigShotBob) 2016-01-29 05:04:00

發展了好幾年的樣子

作者: ddavid (謊言接線生) 2016-01-29 05:04:00

的MCTS能讓妙手出來的機會變多。可是這個問題會轉嫁到事後評估某一手是否妙手上，結果是背景知識從不同的地方切入，然後我覺得後者就是能「有機會」達到更高界限但是評估更難這樣不用MCTS就是徹底的從舊局學習對吧？MCTS我看起來就是提高學習上限的手法，他們實際裡面有什麼技術細節我不知道當然就沒辦法評論了XD

作者: BigShotBob (BigShotBob) 2016-01-29 05:09:00

說不定第一作者Aja Huang也是鄉民

作者: ddavid (謊言接線生) 2016-01-29 05:10:00

作者: aaaba (小強) 2016-01-29 05:11:00

希望三月不要同時是起頭也是結尾，這樣屁股還沒坐熱戲就演完了@@

作者: ddavid (謊言接線生) 2016-01-29 05:11:00

總之三月那戰還是可以期待的是不看好直接能贏啦，就看下到什麼程度了

作者: orze04 (orz) 2016-01-29 06:50:00

連環劫交換不斷多處騷擾這些戰術或許有用？這五場奇怎看怎怪雙方下得都很“平”甚至有點懷疑有作假人類方有些棋部是連段位以下都不太可能會下出的

作者: Vick753 (彬彬) 2016-01-29 08:49:00

好猛推個

作者: ztdxqa (ztdxqa) 2016-01-29 08:51:00

該怎麼下就怎麼下堂堂正正的不用搞戰術最好

作者: aaaba (小強) 2016-01-29 12:58:00

打亂局面會先考驗到自己的臨場計算能力，這電腦不會怕吧，個人覺得佈局階段精心準備幾把飛刀會比較有效。還沒看完棋譜，不曉得電腦對引征的敏感度有沒有學到位，這比較像是人會特別去檢查但deep learning沒有特地處理的觀念

作者: tsai18 (......) 2016-01-29 14:16:00

但3月才比這近半年時間電腦搞不好又強了不少

作者: staristic (ANSI lover) 2016-01-29 14:56:00

蠻希望google開一個伺服器讓大家挑戰的，以google的能力，這應該是小菜一碟

作者: aaaba (小強) 2016-01-29 15:16:00

研究人員會不會曾經偷偷放電腦到網棋上砍翻過幾個P，才來約戰小李

作者: angelsoul (哩囉) 2016-01-29 17:08:00

這篇不能不推

作者: para123 (好心情，事才會做好) 2016-01-29 19:52:00

看完譜心得：台灣有好幾千個世界冠軍

作者: chaoyang (從創造感受生命) 2016-01-29 21:09:00

原來是Aja 他應該是台灣六段應該也是鄉民

作者: milkdragon (謝謝大家!!) 2016-01-30 00:34:00

安永吉八段講評第一局 https://goo.gl/W9ywcU

作者: Tabrith (è¡€ç³–ç‘ªçªæœµ) 2016-01-30 12:49:00

好文推

作者: jerrysaikou (jerry) 2016-01-30 23:09:00

推用心分析由這譜看來李世石必勝

作者: reflow (好想看雪) 2016-01-31 23:46:00

目前看棋譜我覺得我能贏這個電腦，但不敢說絕對必勝~"~

作者: bearching (Pandora`s Box) 2016-02-04 01:35:00

請問如果以強化學習的系統來說，如果這個目前的這個AI程度，要是開放給大量新中手下或是輸入極大量新中手的譜，那這個AI理論上應該會變弱沒？另外我想是否這個AI的弱點一樣在於劫爭跟棄子戰術的部分呢？

作者: ddavid (謊言接線生) 2016-02-04 03:33:00

輸入大量新中手的棋譜會不會弱回來 → 看設計，如果沒有特別設計確實有可能真的弱回來。劫爭棄子是否較弱就交給比較了解AhphaGo細節的幾位來答XD

繼續閱讀

[實況]第40期棋聖戰七番棋第二局井山vs山下forfunmerely Re: [棋訊] 圍棋AI首次分先戰勝職業圍棋手staristic Re: [棋訊] 圍棋AI首次分先戰勝職業圍棋手staristic Re: [棋訊] 圍棋AI首次分先戰勝職業圍棋手staristic Re: [棋訊] 圍棋AI首次分先戰勝職業圍棋手staristic Re: [棋訊] 圍棋AI首次分先戰勝職業圍棋手staristic [情報] 2016台日交流賽cabon [新聞] 井山裕太夫妻離婚Lottery [棋訊] 圍棋AI首次分先戰勝職業圍棋手pellucid [問題] 李世民下圍棋solomn