根據AlphaGo弈城圍棋網的疑似測試對局預測

作者: danielcz (白水煮蛙)   2016-03-06 11:34:41
http://www.guancha.cn/chenjing/2016_03_05_352980.shtml
陳經﹕根據AlphaGo弈城圍棋網的疑似測試對局預測谷李大戰比分
弈城圍棋網有一個賬號叫deepmind。2016年1月28號谷歌Deepmind小組開發的圍棋程序
AlphaGo戰勝職業選手的勁爆消息出來之後﹐這個賬號名引發了棋迷的關注。之後AlphaGo的
共同第一作者Aja Huang發貼說﹐這個賬號是他本人的﹐但否認是AlphaGo。對此我們根據
deepmind的歷史戰績進行一些推測。
2014年4月2日﹐deepmind在弈城下了第一盤棋﹐一開始注冊是5D。半個月時間﹐這個賬號分
別以17勝1負和15勝3負的成績﹐升上了6D和7D。弈城圍棋網5D及以上的升段規則是和同級別
對手下“升降級對局”﹐最後20局裡勝15局升1段﹐全勝升2段。然後deepmind就在7D與8D之
間上上下下﹐從2014年4月17日到2015年9月16日長達1年半的時間﹐一共五次從7D升到8D﹐
四次從8D降到7D﹐下了300多盤。這個戰績是標準的強7弱8﹐也符合Aja Huang台灣業余六段
的水平。這一切都很正常。
之後發生了奇妙的事情。2015年8月23日﹐deepmind第五次打上了8D﹐升段當天連下了6盤﹐
還全輸了。之後到8月29號7連勝﹐9月4號5號又四連敗。然後到9月16號﹐8勝1負﹐累計戰績
15勝5負﹐首次升上了9D﹗打上9D以後當天下了一盤﹐輸了。然後接近三個月沒下棋。一個
強7弱8﹐偶而運氣爆棚沖上9D也是可能的﹐正常的軌跡應該是迅速掉下8。
接下來在2015年10月﹐谷歌和樊麾二段簽了保密協議﹐讓AlphaG和他下了5盤正式對局5:0﹐
2016年1月28發布消息時棋譜也公布了。還有5盤非正式對局﹐樊麾贏了2盤﹐棋譜未公布。
2015年12月2號﹐deepmind重新開始在9D上下棋﹐一直到2016年2月28日﹐一共下了136盤。
一開始就在9D上打了一波13勝2負﹐表現得象一個強9。然後12月底到2016年1月﹐一波8連敗
掉到8D了﹐這個戰績到是很象強7弱8。然後迅速地15勝5負﹐2016年2月2日回到9D。升上9D
又是一波15勝2負。之後時勝時負﹐一直在9D。
2月27號開始﹐deepmind更多地和職業棋手對局了。弈城賬號標注為P的是經過驗証的職業棋
手﹐deepmind勝了mob(P)﹐輸給了另三位。對手中也有雖然未標注為P﹐但和職業棋手賬號
互有勝負的強9﹐如amalauag﹐從歷史戰績看也是有職業棋手實力的。deepmind和amalauag
下了三盤﹐2勝1負。
如果是Aja Huang本人下﹐很不可能對9d取得經常性的連勝﹐更不可能和職業棋手們互有勝
負﹐差距應該在三子左右。合理推測﹐谷歌圍棋到弈城網上測試也屬正常。2月23號谷歌與
李世石人機大戰發布會公布的信息﹐3月8號到15號代表AlphaGo與李世石在棋盤上進行五盤
對局的﹐正是Aja Huang。他負責擺放棋子﹐並輸入招數到機器。這也可以說是Aja Huang在
下棋﹐他發貼說deepmind是自己在弈城上下也可以解釋。谷李大戰在即﹐谷歌加緊測試﹐在
弈城上更多找職業棋手過招。
如果說以上是基於戰績的推測﹐可以進一步看下棋譜的印記。
AlphaGo執黑對樊麾
這是AlphaGo與樊麾的第二盤對局﹐開局就是一個大雪崩定式。第31手﹐AlphaGo下了這招明
顯異常的“點”﹐與白32擋交換。幾個職業棋手都指出﹐這個點和白擋的交換﹐有明顯的潛
在損失。本來不點﹐黑擋在G2位是個先手﹐白要應的。現在有了白32立的硬腿﹐黑再要擋在
G2位﹐就不是先手了﹐因為接下來黑收氣﹐白可以A2吃掉黑。
AlphaGo執黑對樊麾
如果一定要下點這招﹐那麼點了以後﹐黑也應該立刻A6爬回﹐與白A2交換。接下來黑A7接是
先手﹐能保証黑是絕對兩眼活棋﹐還不損空。然而AlphaGo沒有走﹐如上圖讓樊麾38搶先扳
到與AlphaGo的39接交換﹐空損了。接下來如果白B11點﹐黑這塊將隻有一個眼。31的點以及
後續讓白搶到38扳﹐AlphaGo的損失雖然不大﹐但確實是明顯的問題手。
2014年7月30日﹐阿含桐山杯8強賽柯潔執黑對古力
職業棋手和業余高手肯定不會這樣下的。如上圖﹐古力對柯潔也下了同樣的大雪崩。古力第
40手也點了﹐但點的時機是﹐白右邊S13的擋已經不可能下到了﹐不需要保留了。而且後來
古力44手搶先爬回定型﹐保証兩眼。柯潔43手不能扳N19吃三子太小﹐古力44就爬了。
弈城圍棋網2015年12月6日﹐deepmind執白對Reminisce
上圖是deepmind和Reminisce的對局﹐也是大雪崩。第50手﹐deepmind和AlphaGo一樣下了這
個點﹐也同樣沒有T6爬回﹐被對手55手搶先扳到。當然和AlphaGo那局一樣﹐虧的不多﹐對
手也和樊麾一樣後面殺崩了迅速敗陣。
看到deepmind這個賬號在弈城圍棋網上離奇的戰績軌跡﹐以及棋譜上與AlphaGo的不謀而合
﹐對網絡圍棋比較熟的棋友們大概心裡有數了吧。
顯然﹐這也是近來和deepmind對局的弈城9D及帶P的職業棋手們的感覺。他們和deepmind對
局時似乎明白網絡另一頭是誰﹐紛紛出招測試﹐下了不少精彩的棋。
除去deepmind在9d上明顯是Aja Huang本人在下的連敗對局﹐大致可以評估一下它的實力。
有興趣的可以到弈城圍棋下載客戶端、注冊賬號﹐自己查找deepmind的所有棋譜觀看。
對於一般的9d﹐deepmind﹐或者說背後的AlphaGo有明顯優勢﹐可以輕鬆地連勝。棋譜上表
現出來就是大局觀好﹐空很容易就領先了﹐或者一個局部下來就佔了壓倒性優勢了。但也不
是特別穩定﹐偶而會輸(也有可能是Aja Huang本人在下)。
deepmind對帶P的職業棋手﹐還佔不到什麼便宜﹐雖然也有勝局﹐但是負多勝少。這些出戰
的職業棋手並非職業強手﹐大致要排名100名以後了﹐和李世石差距不小。但他們比樊麾的
實力要強一些﹐對李世石也不是沒有勝機﹐不是讓先的水平差距。
之前李世石2月16日就人機大戰接受采訪時就說﹐除了與樊麾的對局﹐他還到網上找了三四
盤AlphaGo的棋譜來研究﹐認為是自己讓先到二子的實力﹐有絕對必勝的信心。很可能他找
的就是deepmind在弈城網的棋譜。之後deepmind在弈城上又和更強的對手下了多盤﹐感覺實
力有所提升﹐李世石讓先不一定行。
大致可以判斷﹐AlphaGo在弈城上進行測試﹐表現出來的是職業棋手中較弱的水平﹐但顯然
是有職業水平的。而且可能它是用單機版進行測試﹐人機對戰時顯然會用多得多的服務器。
但也不會帶來很大的水平提升﹐根據谷歌發表在《自然》上的文章﹐服務器版對單機版也隻
有77%的勝率﹐大約3﹕1的戰績。
人機大戰將在2016年3月8日開戰﹐也沒幾天了。如果弈城上deepmind賬號這幾天的棋譜能體
現AlphaGo的實力﹐那麼和李世石還是有著明顯的實力差距。但這種差距不是業余棋手與職
業棋手之間那種絕對水平的差距﹐已經可以談勝負概率了。
李世石必須小心應對﹐甚至不能有“上手心態”﹐必須把對手當作一個職業棋手來認真對待
。特別的是﹐職業棋手對局﹐低手就算暫時領先﹐高手仍會有大把機會。因為低手面對“勝
機”會出現心理波動﹐高手會選復雜的下﹐低手心理緊張再加時間不夠﹐犯錯送回來很常見
。但AlphaGo的表現會非常穩定﹐算得也很快﹐李世石出了致命錯誤以後﹐想靠攪局翻盤不
會成功。
李世石29日接受韓國電視台采訪
李世石說﹐作為人類代表﹐要取得五盤全勝﹐因為輸一盤就會給出電腦將要取勝的危險信號
。他想一盤不輸﹐必須從一開始就非常小心﹐抓住AlphaGo的一些不嚴謹的小錯﹐建立並擴
大領先優勢。五盤對局﹐每盤雙方手數以250手計﹐李世石要下600-700手﹐出現致命錯誤的
概率還是有的。
如果要預測比賽勝負﹐李世石肯定會獲勝﹐得到100萬美元獎金。五番棋高手的勝率遠高於
單局勝率。柯潔對李世石如果有4﹕1的勝率(目前為7﹕2)﹐他聲稱的“夢百合杯五番決賽
李的勝機不足5%”在數學概率上就是一個合理估計。這次柯潔估計AlphaGo對李世石的勝機
還不到5%﹐直覺上也是成立的。
但是這比賽不管勝負要下滿五盤﹐李世石想五盤全勝也不容易。預計谷李大戰﹐最後比分為
4﹕1。李世石勝出維護人類尊嚴﹐但AlphaGo取得的進展也繼續令人驚嘆。
作者簡介﹕筆名陳經﹐香港科技大學計算機科學碩士﹐中國科學技術大學風雲學會研究員﹐
棋力新浪圍棋6D。21世紀初開始有獨特原創性的經濟研究﹐2003年的《經濟版圖中的發展中
國家》預言中國將不斷產業升級﹐挑戰發達國家﹐2006年著有《中國的“官辦經濟”》。
本文系觀察者網獨家稿件﹐文章內容純屬作者個人觀點﹐不代表平台觀點﹐未經授權﹐不得
轉載﹐否則將追究法律責任。關注觀察者網微信guanchacn﹐每日閱讀趣味文章。
作者: Seikan (星函)   2016-03-06 14:07:00
不管專家說什麼 反正5:0我是押定了 若真的小李掉了一盤全部給押AG會贏的人分紅也罷~
作者: HiedanoAkyuu (依靠小鈴吃飯的阿求)   2016-03-06 14:28:00
召換AJA
作者: cute64627732 (香吉士)   2016-03-06 16:47:00
DeepMind:召喚佐為
作者: qqq1397 (渾汲噩營)   2016-03-06 19:14:00
佐為大概七冠王井山,才剛輸小李
作者: sixersai (鍵盤華生)   2016-03-07 01:47:00
鬼扯什麼 只要輸一盤就等於輸了 4:1就是人類失敗
作者: roujuu (老中)   2016-03-07 22:21:00
小弟本來要轉貼本文網址到FB的,算了,就當做小弟沒看到這一篇文章。

Links booklink

Contact Us: admin [ a t ] ucptt.com