Re: [討論] 關於 李世石 VS AlphaGo & AI 進步程度

作者: ginstein (邁向學術之路)   2016-03-10 08:28:57
因為本身對於一些專業的圍棋方面知識並不足夠,
但對電腦 AI 方面的進展還是有一些了解,
所以想提供另一種觀點以供參考。
※ 引述《wukevinboy (wukevinboy)》之銘言:
: 3.這是最主要的一點,在與樊麾對弈時的 AlphaGo 我覺得水平只有弈城
: 七、八段,至於 AlphaGo 是否有遇強則強,愈弱則弱只要贏就好的特性
: ,或許這是值得觀察的一個點。(可能等到軟體流出經過多人實際測試,
: 我們才有機會得出相關的結論。)
: ... (恕刪)
: 在一開始我對於 AlphaGo 的評價是不高的,現在想想 AlphaGo 水平或許真的
: 是因為對手,導致水平下降,樊麾那五盤棋的水準大約是在台灣業七實力,甚
: 至業餘六段可能都跟他有得一下,導致我覺得 AlphaGo 贏他也並沒什麼好大驚
: 小怪的,當時會出來評論僅僅是因為有太多的讀資訊相關的人不懂圍棋規則、及
: 判斷,各種謠言滿天飛,所以想跳出來先講講看,避免大家有圍棋已經可以征服
: 職業領域的錯覺。
: ... (恕刪)
: 然而我現在必須很誠實地告訴大家, AlphaGo 的棋已經具備了職業實力,而在與
: 樊麾對弈時,我們這些業餘棋手感覺不出 AlphaGo 的實力,主要原因是因為樊麾
: 下得實在不怎麼樣,就像你今天看 Kobe 去跟小學生打籃球,小學生被電得慘兮兮
: 也不足為奇(當然這說法有點誇大)。
AlphaGo 並不是遇強則強,而是像人類一樣,隨著訓練而會變強,
可以參考以下 U2 短片,以訓練簡單的打磚塊為例,最後成為超級專家,
Google DeepMind's Deep Q-learning playing Atari Breakout
https://www.youtube.com/watch?v=V1eYniJ0Rnk
只不過 AI 成為打磚塊的超級專家,不會讓人覺得這有什麼,
但是在圍棋領域上,AlphaGo 成為職業級玩家還是令人震驚!
人類歷史上各種發明工具,創造出超過人類本身能力的例子比比皆是。
而 AI 的學習能力超過人類也是早晚的事,
只是超過大多數人(包含我)的預期,等到這一戰才發現這時代已經到來。
: 然而看到不少人在以李世石這位棋手指指點點,我想請問那些不曾關注圍棋,還有其中為
: 數不少的鄉民,如果你們連李世石是一位怎樣的棋手都不知道,甚至有人連圍棋規則都不
: 知道,就在大放厥詞,不是很不理智的行為嗎?最近還看到有人說,以X國人水平來看,
: 李世石要贏可能要靠作弊,真的覺得這種言論令人哭笑不得,希望大家可以尊重這次的比
: 賽。
同感!AlphaGo 昨天勝過頂尖職業棋士李世石時,
太多人片面的以為 AI 真的沒有弱點,
很多職業棋手和軟體多下幾盤後,
就能發現軟體演算法的盲點,從而大肆利用以玩弄電腦。
李世石在開賽前看不到 AlphaGo 本身的對弈棋譜,
只能在一兩盤內找出 AlphaGo 的特性,這對李世石太不利了,
即使五盤皆輸也不代表之後棋手不能發現 AlphaGo 的盲點。
有了解 AlphaGo 演算法的人,讓職業棋士了解其思維模式特點,
目前應該還是很有機會贏過 AlphaGo 的。
從一些評論可以發現 AlphaGo 的特點,
布局較快進入纏鬥模式(其強項),
不像人類布局較久,對弈較常出現劫材,
可見對弈時,棋手被 AlphaGo 牽著走,
我猜想如果 AlphaGo 一開始就想引戰時,
棄一角換取更廣的布局時,也許有機會。
不過本身對於一些專業的圍棋方面知識並不足夠,
還是給職業棋士去發現 AlphaGo 的特點,聽其評論。
作者: Eriri (英梨梨)   2016-03-10 09:00:00
我覺得依照阿法狗的演算方法 你很難知道到底是真正的盲點還是阿法狗看到了更遠而做這種選擇 只有真正多下才會知道而無法單以少數幾盤而論
作者: abc55322 (笨鳥不唱歌)   2016-03-10 09:21:00
劫多是因為知道自己有利吧
作者: woogee (woogee)   2016-03-10 09:34:00
有看到對岸文獻說AlphaGO會盡量引導對方走向自己已學習過的走法,真偽有待確認
作者: aaaba (小強)   2016-03-10 09:45:00
上面這個說法算是倒果為因
作者: undeadj (undeadj)   2016-03-10 09:49:00
序盤是李逼戰才戰的
作者: javatea (齁齁)   2016-03-10 09:54:00
現在有盲點, 以後還會有嗎? 何謂自我學習?
作者: aaaba (小強)   2016-03-10 09:58:00
alphaGO能下出來的每一手,當然都可說是他學會的。如果他考慮得夠周密,人類接下來的應對自然不脫它的意料,局面便順理成章的向AlphaGo傾斜了。反正樓上的說法就等同於高手的定義,而非alphaGo的特殊技。柯潔也說過:跟李下時,他希望李下出他意料之外的棋,因為那表示那手不夠好,早被他排除了。我是說5樓的說法
作者: wukevinboy (wukevinboy)   2016-03-10 10:47:00
其實用想的也大概瞭解,應該不會有遇強則強的狀況,但是因為就這幾譜,我才有這種幻覺…感謝您的回覆,補充。
作者: coldlian (荀文若)   2016-03-10 11:19:00
打磚塊看起來超聰明
作者: sadmonkey (下雨天)   2016-03-10 11:19:00
據我所知跟蒙地卡羅相關的演算法收斂都很緩慢,昨天電腦所花的時間並非是故意障眼法,而是程式在模擬無數條路徑所需的時間,而以蒙地卡羅收斂速率也許增加一萬台電腦也只是微微增加一點棋力,我反而覺得最後電腦圍棋遲早會遇到瓶頸,只是不知這個瓶頸到來前的棋力是否能穩贏人類的頂尖棋手
作者: newtonyd (newtonyd)   2016-03-10 11:45:00
到時候會先檢討黑到底貼幾目才是真的"公平"
作者: Ebergies (火神)   2016-03-10 11:49:00
AlphaGo 自己持黑白子對練到 50% 左右勝率應該有參考性?
作者: s93rm6 (Milks)   2016-03-10 12:11:00
這比賽是用單機版的 不是多主機的系統

Links booklink

Contact Us: admin [ a t ] ucptt.com