作者oldTim (TIME WILL TELL)
看板GO
标题[新闻]FB团队成功复制AlphaGO Zero并免费开源
时间Thu May 3 22:05:22 2018
AI 围棋新里程!
Facebook AI 团队成功复制 AlphaGo Zero/AlphaZero 围棋程式并免费开源
https://tinyurl.com/yagztj34
脸书 AI 团队(Facebook AI Research ) 近日成功复制 AlphaGo Zero/AlphaZero 的围
棋程式, 已经开源并免费给所有人使用。
脸书 AI 团队的围棋程式「ELF OpenGo」复制 了 AlphaGo Zero/AlphaZero ,究竟它
的 棋力有多强大呢?根据 脸书 AI 团队(
https://tinyurl.com/ybmjnjcp) 表示
,ELF OpenGo 已经成功对付其他开源机器人和人类玩家。与公开可用最强大的机器人
LeelaZero 打了 200 场比赛获全胜,
还与世界排名前 30 的人类棋手里其中四位对弈
达 14 胜 0 负的战绩。全程使用一个 GPU 每50 秒进行一次动作,并且给对弈玩家
无限思考时间。
受 DeepMind 的启发,脸书 AI 团队於今年启动轻量级框架(ELF)进行强化学习
(Reinforcement Learning) 研究,除了再现 AlphaGoZero 的惊人成果,另一方面创造一
个开源系统,对 AI 与围棋界做出贡献,在这次开源的代码和模型显然激励业界对此技术
新的应用和研究发展方向。
稍早 AlphaGo 首席工程师黄士杰在个人脸书上也向大家分享这项消息,表示祝贺与乐见
其成,关於研究详细论文及开源码都已公开在 官方部落格 ,有兴趣的朋友可至连结查看
。
https://research.fb.com/facebook-open-sources-elf-opengo/
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.37.131.150
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/GO/M.1525356327.A.3BA.html
1F:推 abc0922001: 现在好像还没有人能用他们开源的东西 05/03 22:38
2F:→ abc0922001: 200:0 LZ 好像是作者搞错了什麽 05/03 22:40
3F:推 jamesho8743: 已经有人把它转成LZ可以用的权重格式了 b99ff043 已 05/04 01:44
4F:→ jamesho8743: 经上线测试中 05/04 01:44
5F:推 HeterCompute: b99有转换错误,价值网路完全错误 05/04 01:46
6F:推 jamesho8743: 嗯 真是几分钟又有新的发展 b99ff043 有问题 05/04 01:49
8F:→ abc0922001: gcp放的,应该是可以用 05/04 10:38
9F:推 abc0922001: 重新比一次,是198:2 ,这真恐怖 05/04 10:42
10F:推 abc0922001: gcp自己测试,27:5 似乎没差这麽多 05/04 10:53
11F:推 jamesho8743: 新的应该是62b5417 然後leelaz主程式要用修改过的 才 05/04 11:51
12F:→ jamesho8743: 能使用fb的权重 05/04 11:51
13F:推 ztdxqa: 哇 这超级大新闻 05/04 11:55
14F:推 jamesho8743: 是啊 在吸收利用fb的权重之後 leela的棋力要大跃升了 05/04 12:07
15F:推 humandry: 对韩职的12盘还有对LZ的998盘棋谱也公布了 05/04 12:16
16F:推 staristic: 请问楼上,有连结? 05/04 13:07
17F:→ abc0922001: 就FB开源的github release 上 05/04 13:12
18F:推 staristic: thx 05/04 13:26
19F:推 asglay: 980/998 胜率还是超高 05/04 16:08
21F:推 zzzz: 请问一下修改过的主程式是什麽意思?现在我没法跑那个权重 05/04 18:49
22F:推 jamesho8743: leelaz.exe 要是修改过的 05/04 19:11
23F:推 aegis43210: 用了2000个V100跑了两周,训练量肯定有Leelazero两倍 05/04 19:34
24F:→ aegis43210: 以上,支援CUDNN果然强大,但openCL连A卡都也能训练, 05/04 19:34
25F:→ aegis43210: 各有长处 05/04 19:34
28F:→ abc0922001: 跟以前设定leelaz.exe一样,权重跟exe换而已 05/04 20:46
30F:推 siyaoran: 轻量化真是不错 05/04 21:29
31F:推 jamesho8743: 野狐今晚很热闹 LEELA ELF 赢了金毛一盘 连骊龙也都 05/04 22:59
32F:→ jamesho8743: 出关了 05/04 22:59
33F:推 asglay: 竟然可以赢金毛 太吓人了 金毛可是冠军啊 05/04 23:35
34F:→ jamesho8743: 金毛测试 不知道跟比赛是不是同版本 配备应该是较差 05/05 00:17
35F:推 bjiyxo: alphaleela当时是我在操控的,他从一开始胜率2X%追回来 05/05 00:19
36F:→ bjiyxo: 真的猛,能这样赢金毛我也是吓到了 05/05 00:19
37F:推 aegis43210: GCP会用ELF的权重训练吗?或是一切照旧? 05/05 00:45
38F:推 jamesho8743: 简单测了4盘 ELF 全胜 Leela V130 05/05 00:55
39F:→ jamesho8743: 原来是b大 真是精彩的一盘棋 ELF 杀大龙完胜小金毛 05/05 00:57
40F:推 jamesho8743: leela elf 明显比原版的elf go弱 还不是完全体 他们 05/05 12:56
41F:→ jamesho8743: 两个一些参数范围如puct值不同 可能还得再修改 05/05 12:56
42F:推 abc0922001: LZ更新了 05/05 13:23
43F:→ jamesho8743: puct 的问题 新版还没解决 新版就是可以吃ELF的权重 05/05 13:29
44F:→ jamesho8743: 不用另外修改主程式 还有可以直接吃 .gz压缩的权重 05/05 13:29
45F:→ jamesho8743: 不用先解压 05/05 13:29