[新聞] 天壤:對戰朴廷桓只是表演賽

作者: joanzkow (星浪)   2018-05-16 07:15:47
天壤:對戰朴廷桓只是表演賽 圍棋AI未來大有可期
 分文章來源:弈城圍棋網
  自福州世界人工智慧圍棋大賽和柯潔的第二次“人機大戰”之後,人工智慧圍棋賽事
和活動暫時告別了一個高潮,各家圍棋人工智慧也都紛紛在家休整,繼續提高,以迎接下
一個圍棋人工智慧的盛會的到來。棋界紛紛也對圍棋人工智慧未來的發展產生聯想和猜測

  天壤智慧圍棋在5月26日將在杭州雲棲小鎮舉辦2050大會的活動——“天壤AI圍棋論
道”。該活動也是圍棋人工智慧第一次大規模公開近距離與普通棋迷朋友交流的活動。那
麼2050大會是一個什麼樣的活動?天壤圍棋屆時將會以什麼樣的形像和方式與大家交流?
天壤圍棋最近發展怎麼樣,他們對人工智慧圍棋的未來有什麼樣的看法和規劃?我們對天
壤圍棋團隊進行了一次專訪。
  問:天壤最近發展如何?和上一次出來參加AI龍星戰時相比有什麼進步麼?
  天壤:自從AI龍星戰以後,天壤還是繼續在提高自己的棋力水準。年初進行了一些線
上的測試,和多位世界冠軍、全國冠軍進行線上對弈,最後在15連勝之後輸了,也發現了
一些過去的問題。後面就全力去進行selfplay(“自我對弈學習”)去提升自己的棋力。
2050大會的時候,天壤AI的棋力棋力肯定會比龍星戰的時候強。在CGOS上,Pegasus、
Hercules這兩個希臘神話人物也是我們天壤AI,在某個階段也都相應地達到了當時CGOS的
第一名水準。這兩個版本也都是低配少資源的測試版。
 問:天壤最近研發的技術路線和方案是什麼?有沒有做自己的一些創新和探索?
  天壤:在龍星戰之前我們已經開始去探索AlphaGo的第二篇論文,也就是不需要人類
知識的強化學習方法去提升棋力的方法。限於時間,我們在龍星戰的時候還是只做到了一
小部分的探索,並沒有用selfplay的方法去“進化”很多輪。那麼在龍星戰之後我們有了
充分的時間,我們就對從“零”開始、和從人類知識開始兩種selfplay“進化”的方法都
做了一些探索。在人類知識和自我進化結合的這方面我們探索得比較多,相應的也掌握了
一些關鍵技術可以使用人類知識去快速讓其他領域的AI達到一個相對比較高的水準。
  首先,我們自己構建了一套分散式對戰和訓練的系統,該系統可以做到在大規模的資
源集群上自動化反覆運算和訓練。並且這套系統具有一定的通用性,對於資源也可以很有
效地利用,將來將作為我們天壤的所有AI業務落地應用的基礎設施。天壤的分散式自動化
訓練系統共包含:調度、中繼資料管理、模型訓練及評估、資料生成、系統監控等模組。
  其次,在模型訓練方面,我們探索了一種人類資料和selfplay資料混合訓練的方法,
使得模型可以忘掉人類資料中的弱招,儘快學習到selfplay資料中的妙招。同時,我們實
踐了線上擴大模型容量的演算法,可以保留之前小網路模型學到的知識,並無縫切換到更
大容量的模型,大幅度提升棋力。在生成資料方面,不同於AlphaGo團隊擁有幾千塊TPU,
我們做了一些探索,盡可能利用較少的計算資源,來更有效的生成更高品質的資料。
  目前通過多方面測試,我們的系統已經達到職業九段水準。希望我們的工作可以讓人
人都可以隨時隨地跟職業九段下棋。
  問:那麼天壤未來對圍棋人工智慧這一塊有什麼計畫或者是想法?
  天壤:天壤圍棋今年目前為止一方面在繼續提升圍棋人工智慧的棋力,另一方面也是
在積極構想圍棋人工智慧在將來能給圍棋帶來什麼。我們在人工智慧輔助圍棋選手、人工
智慧圍棋教學、人工智慧圍棋陪練等等領域都做了一些嘗試。
 像今年,我們就參加了農心杯的直播解說,和女子圍甲也一起舉辦了貫穿整年的“女子
國手
作者: abc0922001 (中士abc)   2018-05-16 08:48:00
分散式對戰和訓練系統,那不是 Leela Zero 嗎XD

Links booklink

Contact Us: admin [ a t ] ucptt.com