[情報] Leela Zero計畫啟動

作者: HeterCompute (異質運算)   2017-11-16 09:00:08
https://github.com/gcp/leela-zero/releases
各位有興趣幫忙產生Leela Zero的就來吧。
打開autogtp.exe就可以開始,
藉由大家的電腦自己對弈,棋譜會上傳給Leela作者,
訓練過程和上船是全自動的,也可以視情況多開(電腦強就多開幾個),
另外一局如果沒對弈完就關閉是無效的。
作者: pan0531 (= =")   2017-11-17 23:25:00
目前看來開局已漸漸向角落靠近了
作者: aegis43210 (宇宙)   2017-11-17 22:02:00
自從開始學38K的學習資料後,每一局都要下到6百多手看起來會是耐久戰了
作者: tlchen (台灣加油)   2017-11-17 21:20:00
若照3000萬/40天,那1.5天約113萬局.似乎兩個月內可達成剛去看一下,作者好像是說,才正在學38K的資料
作者: Uizmp (黑袍法師)   2017-11-17 18:23:00
據作者說, 現在應該學會了當黑方不能太早 pass 了 XD
作者: aegis43210 (宇宙)   2017-11-17 18:22:00
現在實力應該有20K左右
作者: bahamutjr (AT)   2017-11-17 18:11:00
百度圍棋吧 123樓 有人寫了抓取臨時SGF檔的小工具https://github.com/gcp/leela-zero/pull/69作者下個版本應該也會添加這功能
作者: Uizmp (黑袍法師)   2017-11-17 18:04:00
NN進版了, 現在是38K的版本
作者: aegis43210 (宇宙)   2017-11-21 00:38:00
嗯,按照論文所說,如果新版本實力比舊版本差的話那就讓舊版本持續訓練,直到新版本贏舊版本再取代
作者: Uizmp (黑袍法師)   2017-11-21 00:34:00
原來85k的版本沒贏62k所以沒更新, 現在在試107k的版本
作者: pan0531 (= =")   2017-11-20 20:52:00
請問怎麼知道目前總共訓練幾盤了?
作者: humandry (春秋兩不沾)   2017-11-20 21:05:00
作者: wadashi1 (阿拉丁)   2017-11-20 20:02:00
擺了一下棋,基本上還是亂下....還有得搞..
作者: aegis43210 (宇宙)   2017-11-20 19:17:00
CGI都不和罡哥下,訓練過程也很神秘呀
作者: wadashi1 (阿拉丁)   2017-11-20 19:12:00
可惜不是cgi計畫,不然鄉民一定改挺cgi
作者: staristic (ANSI lover)   2017-11-20 17:54:00
XDDDDDD
作者: aegis43210 (宇宙)   2017-11-20 17:42:00
這局可以讓Leela學會白棋不能一開場就pass,哈
作者: tlchen (台灣加油)   2017-11-20 17:41:00
有點無言的一局 https://imgur.com/a/gBpZf
作者: wadashi1 (阿拉丁)   2017-11-20 17:12:00
喔喔....集合眾人之力果然快上許多!
作者: aegis43210 (宇宙)   2017-11-20 17:36:00
這樣一天就能三萬局了,3000萬局只要一千天!順利的話,三年之內,實力超越master的AI就要出現了
作者: humandry (春秋兩不沾)   2017-11-20 15:55:00
autogtp v3已更新 速度變快 可存棋譜 目前累積1600人上傳超過10萬局了!
作者: Pojin (oPTTo阿尼)   2017-11-20 16:50:00
人乾4ni?!你也有在關注這啊XD
作者: Uizmp (黑袍法師)   2017-11-16 09:47:00
這個有趣 看看棋力可以增強到甚麼程度
作者: tlchen (台灣加油)   2017-11-16 10:49:00
以後睡覺前就去幫忙 run 一下好了
作者: iandddy0986 (Pseudotensor)   2017-11-16 10:58:00
Mac 好像打不開謝謝!等等來試看看!
作者: bahamutjr (AT)   2017-11-16 11:29:00
能保存棋譜在硬碟嗎 專案的說明有 但不知道怎麼輸入指令 dump_training white train.txt我怎麼有一盤下了666手還在下阿 Orz 害我不能測試指令ZERO的第一盤亂下填滿 也沒這麼多手 Orzhttps://i.imgur.com/AInIRnc.jpg 724手 終於結束了
作者: semihumanity (沙漠之狐)   2017-11-16 12:35:00
推個!
作者: Pojin (oPTTo阿尼)   2017-11-16 13:47:00
第一場723+1 W+320.5 XD第二場723 B+ 84.5
作者: aegis43210 (宇宙)   2017-11-16 14:39:00
不知道是用幾層的類神經網路,下蠻久的
作者: staristic (ANSI lover)   2017-11-16 14:54:00
499 w+39.5 XDDDDCPU常駐50%↑,我是i5-6400
作者: aegis43210 (宇宙)   2017-11-16 15:20:00
545 W+14.5,我是i3-4130
作者: staristic (ANSI lover)   2017-11-16 15:26:00
想知道存檔的指令+1 試了幾下完全沒頭緒,一盤棋又超久
作者: aegis43210 (宇宙)   2017-11-16 15:28:00
230 W+1.5,有越下越快的傾向,大家一起加速的優勢吧
作者: tlchen (台灣加油)   2017-11-16 15:32:00
723 應該是下到規定的步數. 19*19*2=722. 不知為何加了 1可能判定是大於 722 才停
作者: Uizmp (黑袍法師)   2017-11-16 15:42:00
應該還早吧, 目前看起來 和 隨機落子好像沒差多少
作者: tlchen (台灣加油)   2017-11-16 15:42:00
我剛有一盤,雙方在 143,144 分別 pass, 就結束了....
作者: Uizmp (黑袍法師)   2017-11-16 15:53:00
嗯 pass 的規則有點迷
作者: Pojin (oPTTo阿尼)   2017-11-16 15:54:00
第三場395 B+ 13.5第四場284 W+ 12.5
作者: Uizmp (黑袍法師)   2017-11-16 16:05:00
http://zero-test.sjeng.org/ 目前蒐集了19000盤左右
作者: Pojin (oPTTo阿尼)   2017-11-16 16:11:00
第五場208 W+ 5.5 手數越來越少了第六場150 W+ 6.5
作者: tlchen (台灣加油)   2017-11-16 16:18:00
目前只有283在傳棋譜.若有一千人,那原本訓練一千多年,可以變一年多如果這個主持人是台灣人,那po去八卦板,熱血鄉民們可能可以讓這計畫快很多
作者: Uizmp (黑袍法師)   2017-11-16 16:29:00
上面的連結是兩天前的,然後作者在11hr前發佈了windows版本開起來就算有問題也是幫作者debug, 不至於做白工吧先看有沒有辦法達到 AGZ 36hr 的水準吧 (約略等於 Lee 版)
作者: tlchen (台灣加油)   2017-11-16 16:42:00
Uizmp post link 時, 才 283人,現在超過三百了大概都是這板的板友?
作者: Uizmp (黑袍法師)   2017-11-16 16:47:00
貼吧也有置頂, 多少也有些人加入吧?
作者: aegis43210 (宇宙)   2017-11-16 16:47:00
leela的好處是不管是N卡或A卡都能用,泛用性很高不過zero用了490萬局,一天兩萬也要245天左右
作者: SolarKa6626 (日可)   2017-11-16 19:38:00
對樊麾的第一篇論文,還有zero40天都是接近 3000萬局
作者: staristic (ANSI lover)   2017-11-16 20:26:00
一天三千萬局......而且黃博士也說了,不是放著就會變強,中間可能還有bug感覺是有生之年系列
作者: cubec (cubec)   2017-11-16 20:43:00
如果這程式,有個棋盤顯現下那邊,這樣大家跑起來比較有投入感。
作者: saladim (殺拉頂)   2017-11-16 20:45:00
可以用類似SETI的那套系統來讓大家參與
作者: staristic (ANSI lover)   2017-11-16 21:15:00
原來如此
作者: tlchen (台灣加油)   2017-11-16 21:19:00
如果可以有個選項是可以顯示棋盤, 那的確較有趣每天看看它有沒有稍微進步一點
作者: asglay (收收收尾)   2017-11-16 21:39:00
如果要推廣那顯示棋盤是不可少的
作者: birdy590 (Birdy)   2017-11-16 21:49:00
我想應該是懶得寫 顯示個棋盤吃不了什麼資源現在的硬體cpu應該會很閒才對
作者: BBSealion (海獅)   2017-11-16 22:45:00
也可以每N盤秀一次棋盤啊,反正連續的也看不出什麼變化
作者: wadashi1 (阿拉丁)   2017-11-16 23:06:00
跑完存個棋譜應該是很好的建議!
作者: freddy10100 (HandsomeCro)   2017-11-16 23:17:00
果然Google的運算資源才是成就最強的關鍵
作者: humandry (春秋兩不沾)   2017-11-19 19:53:00
新版62k對上之前最強19k達到8成勝率!大家快上啊~
作者: wadashi1 (阿拉丁)   2017-11-19 20:22:00
這麼快?似乎有點搞頭啊!我也來貢獻一下!我i7-6700 GTX970 CPU:25-40% GPU:20-25%
作者: aegis43210 (宇宙)   2017-11-19 21:57:00
奇怪了,怎麼自己關了,都無法啟動?原來是伺服器有異常,那只能明天再來訓練了
作者: wadashi1 (阿拉丁)   2017-11-21 12:28:00
感覺還在亂下藉由觸發來了解規則跟勝負,不知道還要多久才會讓人有會下圍棋,了解規則,像學了圍棋的新手的感覺?
作者: birdy590 (Birdy)   2017-11-21 14:32:00
目前才累積十幾萬盤 至少還要再十倍以上吧
作者: aegis43210 (宇宙)   2017-11-21 17:08:00
依照論文中,訓練24小時後才脫離ELO負的情況所以至少要訓練75萬盤,這是運氣好情況下
作者: birdy590 (Birdy)   2017-11-22 00:02:00
1 (O10) 2 (pass) 3 (pass) Game has ended.現在還是會下出這種鬼東西
作者: sunev (Veritas)   2017-11-22 00:28:00
版本一樣就會有可能下出一樣的東西,只能期待下個版本了
作者: birdy590 (Birdy)   2017-11-22 00:46:00
上面這個應該已經是 137k 了... 看起來要學的還很多
作者: aegis43210 (宇宙)   2017-11-22 03:08:00
現在還只是訓練5 blocks的神經網路哦無法想像如果是訓練40 blocks的類神經網路,速度會有多慢......,DM真的非常強,有那麼多運算資源就贏了
作者: wadashi1 (阿拉丁)   2017-11-22 09:49:00
真的很強,不管是運算資源還是程式,而且還願意分享程式
作者: sunev (Veritas)   2017-11-22 16:24:00
DM沒有分享程式吧?只有分享演算法
作者: wadashi1 (阿拉丁)   2017-11-22 16:53:00
zero據說不會開源,但之前的有,所以其他ai才會進步這麼快但leela開源出來了,看來會有很多關鍵的地方..還有得搞!
作者: HeterCompute (異質運算)   2017-11-22 19:01:00
別造謠,Deepmind從未對AlphaGo有任何開源的動作
作者: aegis43210 (宇宙)   2017-11-22 20:45:00
個人對leela zero的期望就是達到李世石几版本的強度因為依照現在的參與度,練5 blocks的類神經網路就好
作者: wadashi1 (阿拉丁)   2017-11-22 22:36:00
https://github.com/Rochester-NRT/RocAlphaGo 所以這個是根據論文自己寫出來的,而不是由裡面的開源複製出來的?
作者: HeterCompute (異質運算)   2017-11-22 22:48:00
第一句就寫independent student-led啊@@
作者: wadashi1 (阿拉丁)   2017-11-23 08:48:00
https://goo.gl/PaMSsE DM分享的open Source Codealphago的確找不到官方的,但DM會分享程式是真.
作者: HeterCompute (異質運算)   2017-11-23 13:37:00
對啊,所以我只糾正你AlphaGo沒開源

Links booklink

Contact Us: admin [ a t ] ucptt.com