作者ssccg (23)
看板chess
标题[将棋] 第27回世界电脑将棋大赛
时间Thu May 4 21:53:30 2017
http://www2.computer-shogi.org/wcsc27/
二次预选 决胜
elmo 8-1 7-0
Ponanza Chainer 8-1 6-1 (输elmo)
技巧 6-3 4-3 (输elmo、ponanza、読み太)
大合神クジラちゃん 6-3 4-3 (输elmo、ponanza、技巧)
苍天幻想ナイツ・オブ・タヌキ 5-4 3-4
読み太 6-3 2-5
HoneyWaffle 6-3 2-5
NineDayFever 5-3-1 0-7
=== 晋级决胜 ===
大将军 5-4
Qhapaq 5-4
nozomi 5-4
Apery 5-4
这次Ponanza导入了deep learning、1092 CPU + 128 GPU的Cluster
号称对去年电王战版的Ponanza胜率超过80%
原本想说可能没什麽好看的...
结果又有让Ponanza拿到败场的软体出现
elmo是最近出现在floodgate上、rating超过4000的monkeymagic
参赛使用的硬体只用2 CPU的主机
预定赛後也会公开,又有新玩具可以用了
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.136.46.137
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/chess/M.1493906013.A.E9E.html
1F:推 merhi0506: 电脑赛为什麽会 连下两手 理解不能 05/04 23:25
2F:→ ssccg: 在轮到对方下的时候,传送不合法的指令到server,被判定为 05/05 00:36
3F:→ ssccg: 违规,其实不是真的送了下一手指令,只是规则上算二手指し 05/05 00:38
※ 编辑: ssccg (118.150.36.84), 05/05/2017 00:39:35
4F:→ ssccg: elmo要2连胜ponanza了 05/05 15:45
5F:→ ssccg: 不知道是将棋跟DNN的相性问题,还是只是学习时间还不够 05/05 16:00
6F:推 NeedGem: 觉得围棋只要机率过就好比较适合 DNN... 05/05 16:53
7F:→ NeedGem: 将棋需要严格的将死才算数不太好用 DNN # 除非入玉. 05/05 16:53
8F:→ NeedGem: 赛後... 只有棋谱和评价参数, 程式: Y王!!!!! 05/05 16:54
9F:→ ssccg: やねうら王根本场外参战了,在比赛中推出新版本 05/05 17:02
※ 编辑: ssccg (118.163.87.133), 05/05/2017 17:26:12
10F:推 NewYAWARA: 有点横空出世的味道…而且是免费的,看来千田可以好好 05/05 17:27
11F:→ NewYAWARA: 利用一下了 05/05 17:27
13F:→ NeedGem: 他不负责写 engine, 他的努力都在棋谱和评价参数上了. 05/05 17:40
14F:推 NewYAWARA: 看了一下决赛,双方用的是主流的换角48金37桂29飞,後 05/05 17:40
15F:→ NewYAWARA: 来elmo争取到入玉过程中大幅棋得,最後直接打趴pona 05/05 17:41
17F:→ NeedGem: 从这边到可以赢... 嗯 05/05 17:43
18F:→ NeedGem: 相较於大合神集众人之力还是被那两个玩假的... 囧 05/05 17:48
19F:→ NeedGem: 也许是因为去年Y王本尊有赢到Pona才会有人想这种可能 @@ 05/05 17:51
20F:→ NeedGem: Y王本人觉得这个比赛没钱赚所以不会自己下去拼吧 (X) 05/05 17:53
21F:→ NeedGem: 应该说将棋不太适合直接把 DNN 丢上去用... 05/05 18:54
22F:→ ssccg: クジラ好像用去年电王版本的Apery(这次参赛的Apery也是) 05/05 19:18
23F:→ ssccg: 众人之力的效果还是看的出来啦... 05/05 19:20
24F:→ ssccg: 明年要拿到优胜可能至少要比クジラ+elmo强,可能要R4500+? 05/05 21:11
25F:→ ssccg: elmo看说明是从Apery开始加上各家的学习方法,主要改善终盘 05/05 21:16
26F:→ ssccg: 的强度,从上面那局面可以守住ponanza的进攻可以看出这方面 05/05 21:17
27F:→ ssccg: 可能是目前最强的吧 05/05 21:18
28F:→ NeedGem: 试验一下炎之七番胜负第七局终盘, 用elmo评价参数之後... 05/06 10:00
29F:→ NeedGem: 真的很快就在某一手看到... 28 手诘 (羽生已完蛋) 05/06 10:00
30F:→ NeedGem: Engine 终盘初测: Apery >= Y王 > silent_majority(魔女) 05/06 10:01
32F:→ ssccg: 差不多各家都公开了(差技巧),各家的特色好像是qhapaq序盘 05/07 01:42
33F:→ ssccg: 强,読み太是单机强化版的Y牌引擎(可是我试觉得没Y4.41+强) 05/07 01:44
34F:→ ssccg: pona跟alphago比了一下,DNN好像只有policy network,只用 05/07 01:49
35F:→ ssccg: 在决定各分枝探索的顺序上,剩下的就是cluster化,评价值好 05/07 01:50
36F:→ ssccg: 像都没提到,说不定就是都没有动...评价准确度输人的话找的 05/07 01:51
37F:→ ssccg: 快也没用,2~4名都是NPS几亿的cluster但是输千万级的elmo 05/07 01:52
38F:→ ssccg: alphago在评价用了rollout和value network,value network 05/07 02:03
39F:→ ssccg: 在攻王类的好像CP值不好,rollout在将棋这种不知道什麽时候 05/07 02:14
40F:→ ssccg: 结束的不知道效果如何...不过方法上应该还是有尝试的空间 05/07 02:15
41F:→ ssccg: pona的policy准确率55%跟alphago的57%已经差不多了,再来重 05/07 02:18
42F:→ ssccg: 点还是要放在改善评价方法,至於引擎跟ML比较没关系,比较 05/07 02:21
43F:→ ssccg: 看写程式的人最佳化的功力了 05/07 02:21
44F:→ NeedGem: deep learning 的正确用途目前可能是拿来练评价参数. 05/07 06:19
45F:→ NeedGem: 但是现行的二三驹关系不排除可能也有所局限 (思) 05/07 06:20
46F:→ NeedGem: 攻王需要的是正确的手顺, 用 value network 有其困难点. 05/07 06:21
47F:→ NeedGem: 除了 kk/kpp/kkp 那套之外该有新的评价想法了 05/07 06:23
48F:→ ssccg: 新想法就技巧啊,只是这次没练赢... 05/07 06:39
49F:→ ssccg: 现在学习用的局面是用传统评价自我对战生的,加上policy 05/07 06:43
50F:→ ssccg: network也许能用比较少的时间生出这些资料? 05/07 06:45
51F:→ NeedGem: 刚刚把 usapyon2 dash 丢进 elmo 的 kk/kpp/kkp... 05/07 07:01
52F:→ NeedGem: 当机了wwwwww 05/07 07:01
53F:→ ssccg: 技巧2出了,可以调强度和战型,这可以卖了吧... 05/08 02:10
54F:→ NeedGem: 偷偷试一下检讨棋... 结果三种软体套elmo检讨出来不一样 05/10 16:13
55F:→ NeedGem: (着名实况台: 魔女 # 这边根据之前测试使用 Apery/Y王) 05/10 16:14
56F:→ NeedGem: 太难了先摆一边... 囧 05/10 16:19
57F:推 lwei781: 有新的大魔王 12/07 01:46
58F:→ lwei781: AlphaGO 太凶恶了 12/07 01:47