[新聞] 黃士傑返台分享AlphaGo Zero開發過程

作者: qweewqq (風一樣的男子)   2017-11-08 15:49:23
黃士傑返台分享AlphaGo Zero開發過程
生活中心/綜合報導 2017-11-08 14:02
中央研究院今(8)日指出,谷歌電腦演繹人工智慧(AI)系統AlphaGo的幕後推手黃士傑
,10日將在中研院演講,和外界分享超越人類累積千年圍棋智慧的AlphaGo Zero開發過程

中研院表示,由中研院資訊科學研究所與台灣資料科學協會共同主辦的「2017台灣人工智
慧年會x 2017台灣資料科學年會」明天起一連4天將在中研院登場。
中研院表示,比較特別的是,今年台灣人工智慧年會在10 日邀請谷歌電腦演繹人工智慧
(AI)系統AlphaGo的幕後推手黃士傑,以「AlphaGo-深度學習與強化學習的勝利」為主
題,所做的演講。
今年5月,Google旗下AI實驗室DeepMind公司創造的AlphaGo,與圍棋世界冠軍柯潔在中國
烏鎮對弈,結果以3:0勝出,人工智慧的發展震驚全世界。不到半年,這個實驗室又創造
出更強大的AlphaGo Zero,它完全不需要倚靠人類的知識和指導,從零開始自我訓練,3
天時間就100:0打敗舊版。
在過去,強大的人工智慧得依靠人類事前輸入大量資料,幫助它學習、訓練技能,Alpha
Go成為圍棋大師前也不例外。前不久,DeepMind公司在《自然》(Nature)科學期刊上發
表一篇學術論文〈不需要人類知識就稱霸圍棋〉(Mastering the game of Go without
human knowledge),展示了強化版的程式AlphaGo Zero,證明在全球最困難的棋藝競技
中,人工智慧可以在沒有任何人類知識的基礎上,純粹靠自我學習成為制霸王者。
AlphaGo Zero代表從零開始,DeepMind開發團隊只輸入基本圍棋規則,之後它會自行下棋
,並記錄每次的勝負決策,不停學習,自己成為自己的老師,加上沒有人類的經驗和成規
束縛,讓人工智慧突破舊有的知識限制,發展出新的弈棋策略,達到登峰造極的境界。
DeepMind指出,他們不使用任何人類知識,AlphaGo Zero用上的是新的「強化學習」方法
,透過神經網路和演算法結合,持續自我對弈練習幾百萬、幾千萬場,每次的更新都能增
強、調整系統,用以預測下一步落子的方向和遊戲輸贏走勢。幾天時間內,AlphaGo Zero
就從一塊純潔的白板,在上頭不斷揮灑、創造知識,很快勝過了人類累積千年的圍棋智慧

黃士傑臉書介紹 AlphaGo Zero 的神奇表現:
1、AlphaGo Zero 從空白開始,完全只靠自學下圍棋。
2、僅僅 36 小時,AlphaGo Zero 就摸索出所有基本且重要的圍棋知識,達到了與李世
督B模꘵밊

Links booklink

Contact Us: admin [ a t ] ucptt.com