[新聞] 黃士傑返台分享AlphaGo Zero開發過程 qweewqq PTT批踢踢實業坊

[新聞] 黃士傑返台分享AlphaGo Zero開發過程

作者: qweewqq (é¢¨ä¸€æ¨£çš„ç”·å) 2017-11-08 15:49:23

黃士傑返台分享AlphaGo Zero開發過程
生活中心／綜合報導 2017-11-08 14:02
中央研究院今（8）日指出，谷歌電腦演繹人工智慧（AI）系統AlphaGo的幕後推手黃士傑
，10日將在中研院演講，和外界分享超越人類累積千年圍棋智慧的AlphaGo Zero開發過程
。
中研院表示，由中研院資訊科學研究所與台灣資料科學協會共同主辦的「2017台灣人工智
慧年會x 2017台灣資料科學年會」明天起一連4天將在中研院登場。
中研院表示，比較特別的是，今年台灣人工智慧年會在10 日邀請谷歌電腦演繹人工智慧
（AI）系統AlphaGo的幕後推手黃士傑，以「AlphaGo－深度學習與強化學習的勝利」為主
題，所做的演講。
今年5月，Google旗下AI實驗室DeepMind公司創造的AlphaGo，與圍棋世界冠軍柯潔在中國
烏鎮對弈，結果以3：0勝出，人工智慧的發展震驚全世界。不到半年，這個實驗室又創造
出更強大的AlphaGo Zero，它完全不需要倚靠人類的知識和指導，從零開始自我訓練，3
天時間就100：0打敗舊版。
在過去，強大的人工智慧得依靠人類事前輸入大量資料，幫助它學習、訓練技能，Alpha
Go成為圍棋大師前也不例外。前不久，DeepMind公司在《自然》（Nature）科學期刊上發
表一篇學術論文〈不需要人類知識就稱霸圍棋〉（Mastering the game of Go without
human knowledge），展示了強化版的程式AlphaGo Zero，證明在全球最困難的棋藝競技
中，人工智慧可以在沒有任何人類知識的基礎上，純粹靠自我學習成為制霸王者。
AlphaGo Zero代表從零開始，DeepMind開發團隊只輸入基本圍棋規則，之後它會自行下棋
，並記錄每次的勝負決策，不停學習，自己成為自己的老師，加上沒有人類的經驗和成規
束縛，讓人工智慧突破舊有的知識限制，發展出新的弈棋策略，達到登峰造極的境界。
DeepMind指出，他們不使用任何人類知識，AlphaGo Zero用上的是新的「強化學習」方法
，透過神經網路和演算法結合，持續自我對弈練習幾百萬、幾千萬場，每次的更新都能增
強、調整系統，用以預測下一步落子的方向和遊戲輸贏走勢。幾天時間內，AlphaGo Zero
就從一塊純潔的白板，在上頭不斷揮灑、創造知識，很快勝過了人類累積千年的圍棋智慧
。
黃士傑臉書介紹 AlphaGo Zero 的神奇表現：
1、AlphaGo Zero 從空白開始，完全只靠自學下圍棋。
2、僅僅 36 小時，AlphaGo Zero 就摸索出所有基本且重要的圍棋知識，達到了與李世
督B模꘵밊

繼續閱讀

[情報] 野狐出現神秘高手69連勝不敗qweewqq [閒聊] 某安是不是自我感覺太過良好?rOck0913 [新聞] AlphaGo已經夠聰明了? DeepMind：可以更遠qweewqq [棋訊] [棋訊] 第22屆三星杯世界圍棋公開賽4強FAlin [新聞] 三星杯半決賽Ⅰ唐韋星負安國鉉 qweewqq [轉錄]加藤英樹談圍棋ＡＩ的過去．現在與未來(5)oldTim [轉錄]加藤英樹談圍棋ＡＩ的過去．現在與未來(4)oldTim [轉錄]加藤英樹談圍棋ＡＩ的過去．現在與未來(3)oldTim [新聞] 兩岸大學生人機隊際賽臺灣大學生聯隊勝qweewqq Re: [討論] alphago繼續發展下去ddavid