[新聞] AlphaGo成功關鍵黃士傑：策略結合值網路 amix PTT批踢踢實業坊

[新聞] AlphaGo成功關鍵黃士傑：策略結合值網路

作者: amix (^^) 2016-03-18 23:42:58

AlphaGo成功關鍵黃士傑：策略結合值網路

黃士傑解說機器學習如何讓AlphaGo自我學習。（陳懿勝/大紀元）
【大紀元2016年03月18日訊】（大紀元記者陳懿勝台灣台北報導）谷歌（
Google）旗下DeepMind開發的人工智慧系統「AlphaGo」，日前以4:1大勝韓
國九段圍棋高手、世界冠軍李世石。AlphaGo主要開發者、來自台灣的黃志傑
18日返台及分享經驗，他表示，AlphaGo成功的主要關鍵在於策略網路（
Policy Network）與值網路（Value Network）的分析方式，讓它能在20~30
萬份對戰棋譜中，找出最好的20步，才能夠在此世紀之戰中獲勝。
黃志傑指出，圍棋第一步的下法選擇就高達361種，變化數有10的364次方，
對早期人工智慧來說，根本無法計算。但對AlphaGo來說，運用策略網路來減
少搜尋廣度，從360步只要找到20步；價值網路則是直接判斷盤面狀況，了解
優勢還是劣勢，減少搜索深度，自然會提升勝率。
對於第四局對戰AlphaGo落敗，黃志傑說，當時李世石下了神之一手，以致值
網路發生誤判，接連處在劣勢。由於AlphaGo會在比賽中隨時計算勝率，如果
勝率低於20%就會投降，但為何會誤判，目前仍不清楚詳細原因。
黃志傑說，當AlphaGo通知投降時，他自己有笑了一下，因為他很尊敬李世石
，看過李世石大部分的棋譜與比賽，很榮幸能夠坐在他對面。「我為李世石
高興，因為知道他的壓力很大，4比1是蠻圓滿的結果。」
至於AlphaGo的未來發展，黃志傑表示，未來人工智慧可望運用在醫療及機器
人上，並達到預先診斷、找出病徵，協助醫學診斷。◇
新聞網址：http://www.epochtimes.com/b5/16/3/18/n4666018.htm

作者: devidevi (蜜蜜) 2016-03-19 09:19:00

結果1萬個人有1個人出錯，就被告不完了，這是現在醫生的困境

作者: wadashi1 (阿拉丁) 2016-03-19 11:15:00

黃志傑是誰？

作者: gamania10000 (自助旅行中) 2016-03-19 11:58:00

球給

作者: NCUking (中大王) 2016-03-19 19:54:00

連名字都寫錯這記者…

作者: agario (Agar.io) 2016-03-20 09:31:00

其實這點大公司比個人醫生有利，因為大公司可以買保險一萬人才出錯一次的話說不定保險就完全理賠完，根本不怕~

繼續閱讀

[情報]【Alpha Go VS 李世石】免費圍棋推廣講座adad334 Fw: [新聞]AlphaGo戰勝棋王的秘密？DeepMind成員來台buke [情報] AlphaGo推手黃士傑現身分享奪勝祕訣upu 關於圍棋發陽論(上)BRANFORD [新聞] 柯潔回應谷歌挑戰：能動手就儘量別瞎說zkow [情報] “謝謝啦，李世石”圍棋盤的訂單量一下增pf775 [轉錄] 感謝AlphaGo的貢獻，人機纏鬥剛剛開始ted5566 [新聞] 李世石人情味打動女性人氣超太陽的後裔zkow Re: [問題] 為什麼世界排名的前幾名都偏年輕？kuosos520 Re: [問題] 為什麼世界排名的前幾名都偏年輕？lovepeace83

[新聞] AlphaGo成功關鍵 黃士傑：策略結合值網路

[新聞] AlphaGo成功關鍵黃士傑：策略結合值網路