[將棋] 第27回世界電腦將棋大賽 ssccg PTT批踢踢實業坊

[將棋] 第27回世界電腦將棋大賽

作者: ssccg (23) 2017-05-04 21:53:30

http://www2.computer-shogi.org/wcsc27/
二次預選決勝
elmo 8-1 7-0
Ponanza Chainer 8-1 6-1 (輸elmo)
技巧 6-3 4-3 (輸elmo、ponanza、読み太)
大合神クジラちゃん 6-3 4-3 (輸elmo、ponanza、技巧)
蒼天幻想ナイツ・オブ・タヌキ 5-4 3-4
読み太 6-3 2-5
HoneyWaffle 6-3 2-5
NineDayFever 5-3-1 0-7
=== 晉級決勝 ===
大将軍 5-4
Qhapaq 5-4
nozomi 5-4
Apery 5-4
這次Ponanza導入了deep learning、1092 CPU + 128 GPU的Cluster
號稱對去年電王戰版的Ponanza勝率超過80%
原本想說可能沒什麼好看的...
結果又有讓Ponanza拿到敗場的軟體出現
elmo是最近出現在floodgate上、rating超過4000的monkeymagic
參賽使用的硬體只用2 CPU的主機
預定賽後也會公開，又有新玩具可以用了

作者: merhi0506 (白目光) 2017-05-04 23:25:00

電腦賽為什麼會連下兩手理解不能

作者: ssccg (23) 2017-05-05 00:36:00

在輪到對方下的時候，傳送不合法的指令到server，被判定為違規，其實不是真的送了下一手指令，只是規則上算二手指しelmo要2連勝ponanza了不知道是將棋跟DNN的相性問題，還是只是學習時間還不夠

作者: NeedGem (本當傻蛋的宿命) 2017-05-05 16:53:00

覺得圍棋只要機率過就好比較適合 DNN...將棋需要嚴格的將死才算數不太好用 DNN # 除非入玉.賽後... 只有棋譜和評價參數, 程式: Y王!!!!!

作者: ssccg (23) 2017-05-05 17:02:00

やねうら王根本場外參戰了，在比賽中推出新版本

作者: NewYAWARA (朝霞之前奏) 2017-05-05 17:27:00

有點橫空出世的味道…而且是免費的，看來千田可以好好利用一下了elmo: https://goo.gl/HEhL6M

作者: NeedGem (本當傻蛋的宿命) 2017-05-05 17:40:00

他不負責寫 engine, 他的努力都在棋譜和評價參數上了.

作者: NewYAWARA (朝霞之前奏) 2017-05-05 17:40:00

看了一下決賽，雙方用的是主流的換角48金37桂29飛，後來elmo爭取到入玉過程中大幅棋得，最後直接打趴pona

作者: NeedGem (本當傻蛋的宿命) 2017-05-05 17:42:00

https://pbs.twimg.com/media/C_DEIZmUwAErQ44.jpg從這邊到可以贏... 嗯相較於大合神集眾人之力還是被那兩個玩假的... 囧也許是因為去年Y王本尊有贏到Pona才會有人想這種可能 @@Y王本人覺得這個比賽沒錢賺所以不會自己下去拼吧 (X)應該說將棋不太適合直接把 DNN 丟上去用...

作者: ssccg (23) 2017-05-05 19:18:00

クジラ好像用去年電王版本的Apery(這次參賽的Apery也是)眾人之力的效果還是看的出來啦...明年要拿到優勝可能至少要比クジラ+elmo強，可能要R4500+?elmo看說明是從Apery開始加上各家的學習方法，主要改善終盤的強度，從上面那局面可以守住ponanza的進攻可以看出這方面可能是目前最強的吧

作者: NeedGem (本當傻蛋的宿命) 2017-05-06 10:00:00

試驗一下炎之七番勝負第七局終盤, 用elmo評價參數之後...真的很快就在某一手看到... 28 手詰 (羽生已完蛋)Engine 終盤初測: Apery >= Y王 > silent_majority(魔女)初步亂來的終盤檢證: http://0rz.tw/lebXG (放巴哈...)

作者: ssccg (23) 2017-05-07 01:42:00

差不多各家都公開了(差技巧)，各家的特色好像是qhapaq序盤強，読み太是單機強化版的Y牌引擎(可是我試覺得沒Y4.41+強)pona跟alphago比了一下，DNN好像只有policy network，只用在決定各分枝探索的順序上，剩下的就是cluster化，評價值好像都沒提到，說不定就是都沒有動...評價準確度輸人的話找的快也沒用，2~4名都是NPS幾億的cluster但是輸千萬級的elmoalphago在評價用了rollout和value network，value network在攻王類的好像CP值不好，rollout在將棋這種不知道什麼時候結束的不知道效果如何...不過方法上應該還是有嘗試的空間pona的policy準確率55%跟alphago的57%已經差不多了，再來重點還是要放在改善評價方法，至於引擎跟ML比較沒關係，比較看寫程式的人最佳化的功力了

作者: NeedGem (本當傻蛋的宿命) 2017-05-07 06:19:00

deep learning 的正確用途目前可能是拿來練評價參數.但是現行的二三駒關係不排除可能也有所侷限 (思)攻王需要的是正確的手順, 用 value network 有其困難點.除了 kk/kpp/kkp 那套之外該有新的評價想法了

作者: ssccg (23) 2017-05-07 06:39:00

新想法就技巧啊，只是這次沒練贏...現在學習用的局面是用傳統評價自我對戰生的，加上policynetwork也許能用比較少的時間生出這些資料?

作者: NeedGem (本當傻蛋的宿命) 2017-05-07 07:01:00

剛剛把 usapyon2 dash 丟進 elmo 的 kk/kpp/kkp...當機了wwwwww

作者: ssccg (23) 2017-05-08 02:10:00

技巧2出了，可以調強度和戰型，這可以賣了吧...

作者: NeedGem (本當傻蛋的宿命) 2017-05-10 16:13:00

偷偷試一下檢討棋... 結果三種軟體套elmo檢討出來不一樣(著名實況台: 魔女 # 這邊根據之前測試使用 Apery/Y王)太難了先擺一邊... 囧

作者: lwei781 (nap til morning?) 2017-12-07 01:46:00

有新的大魔王AlphaGO 太兇惡了

繼續閱讀

[公告] 關於samtinum板友文章處理NewYAWARA [西洋] 來談談現代西洋棋在世界上如此風行的原因skyhawkptt Re: [問卦] 西洋棋、象棋、將棋geken Re: [問卦] 西洋棋、象棋、將棋geken Re: [西洋] 有沒有能夠展示棋譜的遊戲或APP呢?POKELJ Re: [西洋] 有沒有能夠展示棋譜的遊戲或APP呢?skyhawkptt [西洋] 有沒有能夠展示棋譜的遊戲或APP呢?aswin12000 [它棋] 請問跳棋可以跳進他人的顏色裡嗎?QOO222 [將棋] 加藤桃子重回獎勵會初段einstean [將棋] 16本將棋電子書超大特價NewYAWARA