[新聞] 李喆:阿爾法讓4子 不代表能讓我們2子

作者: zkow (逍遙山水憶秋年)   2016-03-27 14:04:08
李喆:阿爾法新老版本讓4子 不代表能讓我們2子
新浪體育訊  田淵棟博士隨後趕赴機場。沙龍下半場由李喆和劉知青主講。李喆介紹了
人機大戰中的幾手棋。關於第二局37手的五路肩沖,棋手一開始都感到很意外。人下棋的
思維也會有剪枝的過程,五路肩沖通常是被剪掉的選點。對這步棋的優劣雖然仍存在爭議
,但高手們能夠理解這步棋,起碼拓寬了我們的思 路。
  第四局左下23手碰角也很意外,棋手可能會認為是俗手,是虧損的劫財,在腦海裡固
化的經驗會把它率先排除掉。但通過研究我們發現這步在這個全域 的特定局面下是很可
行的。AlphaGo的絕大部分著法都和職業高手的感覺差不多,但還有一些走法找到了棋手
剪枝錯過的有效資訊。
  劉星:我們在回顧關於第二局37手肩沖時,彭荃和孟泰齡的意見也相反,每個人都會
有自己的看法。柯潔與樸廷桓最近的網棋開局也複盤了這局棋,但沒有選擇這步肩沖,最
後輸掉了比賽。AlphaGo有很多超出了我們想法的招,感覺電腦是基於迅速定型的想法,
而職業棋手更習慣於保留變化,認為這樣是一種藝術。
  李喆:確實,傾向於定型是AlphaGo演算法導致的,因為定型對於它而言對方是有概
率犯錯的。AlphaGo在特定局面下的選點,能幫我們打開 思路。尤其是佈局上,AlphaGo
的很多招不一定是最優解,但它下出的超出經驗的棋能幫我們大幅進步。本身十九路圍棋
也不是僅有一個最優解,它的最優解 是一個集合,很多局面下存在不只一個最優選點。
  由小川:如果能拿到AlphaGo,在任何局面下可以繼續拆解,或許就能更好理解這個
選點的用意了。
  劉知青:AlphaGo基本上每步棋都會有大致28手後續變化,進行進一步搜索,內部資
料會看到他的各種選點的。
  李喆:關於第四局李世石78神之一手,雖然對於職業棋手而言可能並不能奏效,但卻
擊中了AlphaGo的弱點。這步棋起碼滿足了兩個條件:一是下出了AlphaGo認為萬分之一可
能性的落點,二是增加了有效變化與複雜度,這兩點滿足一點很容易,但同時滿足已經非
常困難,而且這步還蘊涵了打劫的變化。李世石這一步不愧被稱為“神之一手”,在對人
的時候或許還算不上,但對AlphaGo時這是體現人類靈性的一手,導致電腦出現了失誤。
AlphaGo 本質上是一個工具,對棋手來說可以提供一些新的認識。人機對弈之前,我們認
為創造力是人獨有的,機器沒有。但AlphaGo的幾步棋,讓我們驚歎它的“創 造力”。棋
盤上的創造力就是下出超出經驗卻有效的棋,這是吳清源大師最擅長的領域。當然,
AlphaGo的“創造力”只是資料處理的結果,“創造力”只是 我們人類的理解方式,AI本
身是與創造力無關的。類似的,AI作詩,如果我們不知道作者是機器,也可能從詩中讀出
情感,產生與作者的精神共通。作品的情感 和價值究竟是作者還是讀者賦予的呢?這在
美學上同樣是值得反思的,其本質是認識論的問題。
  邵煒剛:任何東西都是自身有感覺才會有共通的,比如尖沖那步,本是我們思索排除
掉的,但機器並沒有排除,就下出來了。
  李喆:去年我做7路盤最優解的近似窮舉計算,不需要任何概念,我們也能夠算出最
優解。但在十九路棋盤,我們下棋用到了很多概念和道理。比如基本術語的抽象,比如輕
重、緩急、厚薄、虛實等等二元概念的抽象,比如在此基礎上對策略的抽象,典型如圍棋
十訣。圍棋可以很好地訓練這些思維方式,通過勝負和 複盤來發現道理中正確和錯誤的
地方,這是圍棋中比最優解更高的價值所在。而電腦下棋則是在處理複雜的數學題,
AlphaGo的招是大資料處理、歸納的結果,而我們則是用道理的方式來接收理解,並且用
了很多演繹的方法。這些理解的方式可以在圍棋之外的很多場合都能用到,這種道理的普
遍性是人類思維方式的優 越所在,也是我們之所以能說“棋如人生”的原因所在。把人
類思維的尊嚴寄託在單純計算的效用上,才會誤認為這次人機對弈是人類思維被機器擊敗
,並且不能接受,產生抵觸情緒。AlphaGo本身具有很強的工具屬性,它接收和回饋資料
,説明我們提升棋力以接近圍棋真理,又能在認知論和方法論上提供重要幫助。
關於第四局劣勢下的那些低級下法,是AlphaGo的演算法在劣勢下的一種選擇,蒙特卡洛
演算法使它會認為雖然對方大概率會跟著應,卻總還有不應的可能,即使對方應了,也只
是虧一點點,這點虧損去博對方不應的概率很划算。這也是我們經常看到AlphaGo在沒讀
秒時會選擇“打將”的主要原因。當然,人類的邏輯會告訴我們這是必然會應的,“僥倖
心理”沒有意義,但AlphaGo存在或然性。新老版本的AlphaGo之間能讓4子,但我們不相
信AlphaGo能讓我們兩子。這可能跟AlphaGo下受讓子對局時著法會變弱有關,因為初始勝
率高了。另一方面讓子的AlphaGo則發揮出極限能力。當然,我們希望看到棋譜,才能知
道究竟是怎麼讓四子抗衡的。
  邵煒剛:AlphaGo只是超越了圍棋的競技屬性,但圍棋還有很多其他屬性。比如老友
之間手談一局,就比和電腦下棋愉快很多。
  喆理圍棋沙龍由李喆六段發起,清華圍棋文化交流與研究基金主辦。旨在以沙龍的形
式,吸引志同道合的朋友,從文化、哲學等方面出發,共同思考、交流意見,探尋圍棋的
價值與本質。
  希望參與討論、投稿或參與沙龍延展專案請發郵件至zlweiqi@sina.com,期待您的參
與!
http://sports.sina.com.cn/go/2016-03-27/doc-ifxqswxk9694900.shtml
作者: baconcsie (Bacon)   2016-03-28 00:48:00
好文推,我一直都認為 圍棋趨近無限的變化,讓我們能夠在其之上盡情發揮心性,才是他的價值只是 z尻大,你又這樣濫貼新聞,是不怕又被噓爆,驅離捏?
作者: zkow (逍遙山水憶秋年)   2016-03-28 02:50:00
一天只能貼三篇呀
作者: baconcsie (Bacon)   2016-03-28 09:19:00
哈 之前也在曼聯板看過你
作者: Ommm5566 (56天團)   2016-03-29 15:02:00
洗不膩

Links booklink

Contact Us: admin [ a t ] ucptt.com