[情报] DeepMind AI「AlphaStar」

时间Sat Jan 26 19:27:02 2019

感想先写在前头，这篇有讲到一些设定的部分，事实上每五场都是五个不同模型。然後输的那场有要让AI切萤幕，而且只训练一个星期而已。也就是说别的模型说不定未必会有那个空投拉扯问题。 APM部分的限制不知道到底怎麽设定的，感觉是峰值APM也应该限制一下。 DeepMind AI「AlphaStar」对战《星海争霸 II》职业高手，取得十胜一败成绩 https://engt.co/2Sahn4j 在基本上辗压了围棋界之後，DeepMind 团队将目光放到了自由度更高的即时战略游戏，并且最近都在忙着调校一个新的「AlphaStar」AI，来挑战《星海争霸 II》的职业高手。在上月底连续两组五局对战中，AlphaStar 先全胜了 TLO，接着又在第二组对战中全胜了 MaNa。唯有最後一场直播的对战，才让 MaNa 好歹为人类争了一口气，赢回唯一一场胜利。不过，事情当然不像表面那麽简单。AlphaStar 相对於人类，其实是隐藏优势的。这时候有在玩 RTS 的读者大概会猜是反应速度、或是手速，但其实都不是 -- AlphaStar 的「手速」（也就是每分钟动作数）其实平均只有 277 APM，比起星海职业选手的平均 559 APM 要少了不止一点，再加上 AI 从发现新状况，到计画出合理的回应，中间大约要 0.35 秒的时间，这也比一般职业高手差。在这部份， AlphaStar 完全是靠更有效率的操作，与更经济的决策来弥补的。AlphaStar 真正「作弊」之处，在於它可以同时看到整个地图，当然战争迷雾还是存在，只是 AlphaStar 不像人类对手一样，要一直不停地在地图来回跳动检视，自然也不容易被偷袭罗。 AlphaStar 的训练和其他类似的 AI 系统一样，都是先由观看无数的人类对战影片，来产生一个模型，再由这模型产生一大堆类似但不完全相同的「分身」，再让这些分身下去对打，直到决胜出最厉害的五个 AI「选手」为止。在一个月的虚拟对战中，AlphaStar 的诸多分身份进行了等同於现实时间 200 年的对战时长，最後选出的五个代表每个都有不同的游戏风格，并且是 DeepMind 认为最有获胜机会的。就是这五个代表被推上去与 TLO 和 MaNa 各对战了一次（避免风格重复被看破手脚，同时 MaNa 面对的 AlphaStar 更有经验一点），并取得了十战全胜的成绩。至於最後一场呢？原来这是个「实验版」的 AlphaStar，拿掉了上面提到的那个「隐藏优势」，让模型必需和人类一样时不时地检查一下地图的各个角落，自然也就有错漏重要资讯的可能。虽然也有着一个礼拜的训练时间，但 DeepMind 团队未能让它先与人类选手「切搓」一下，因此与 MaNa 在直播上的对战是它与人类面对面的初战，可惜输给了对方。当然，对我们一般人来说，就是真正具备高度挑战性的游戏 AI 已经不再是个梦想，即使是即时战略这样没有明确的胜败因素、没有完整的资讯、而且需要长远的概念的游戏，AI 都有打败人类的潜力了。有兴趣的话 DeepMind 自己的部落格上有 AlphaStar 与两位人类的对战影片，可以去看看 AlphaStar 采取的各种奇怪的战略罗。 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.36.165.93 ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/StarCraft/M.1548502025.A.A4F.html

1^F：推 Jotarun: APM的说明在这 https://goo.gl/f2kWPy 01/26 19:36

2^F：推 HenryLin123: AI的APM应该要降不然就是不能用API 用滑鼠输入吧 01/26 21:19

3^F：推 jiaching: 看了VOD 人类除了兵力大优不然会战完全被AI的操作完爆 01/26 21:51

4^F：→ hijacker: 闪追操作也很猛剩下一大堆残血的追猎 01/26 21:54

5^F：推 clamperni: 只要APM合理操作就合理 01/26 22:28

6^F：推 HenryLin123: 一点都不合理滑鼠随点随到这样练出一个只会操作的A 01/26 23:26

7^F：→ HenryLin123: I有何意义 01/26 23:26

8^F：推 Jotarun: 1. 就算练出只会操作的AI一样神不然以前怎麽练不出 01/26 23:59

9^F：→ Jotarun: 2. 模拟滑鼠或者机器手臂什麽的都是花招而已 01/27 00:00

10^F：→ Jotarun: 真的要直接限制单位时间数量或特定动作延迟即可 01/27 00:00

11^F：→ Jotarun: 3. 这个不是最後结果不需要现在就盖棺论定 01/27 00:01

12^F：推 gn00604767: 阿法星以後成长到一定程度会不会觉得很屈辱,泥马的 01/27 00:53

13^F：→ gn00604767: 限制我的手速这算是怎麽一回事 01/27 00:53

14^F：推 nissptt: 兵不厌诈，这是我们训练AI的最终目的，能使诈，并预测对 01/27 01:12

15^F：→ nissptt: 手(使诈), 权衡得失以获得胜利。其他的都是附加而已。 01/27 01:12

16^F：推 arrenwu: APM没啥好限制的吧本质上就只是操作比较强而已 01/27 04:54

17^F：→ arrenwu: 职业选手之间进行比赛，也有操作的高低，难道我们就会去 01/27 04:54

18^F：→ arrenwu: 跟操作比较强的选手说请他放慢吗？ 01/27 04:54

19^F：→ arrenwu: 顶多是希望DeepMind不要做出一个只有操作比较强的AI 01/27 04:55

20^F：推 shasen1235: AI如果是靠操作打赢人类就完全违背这个研究的意义了 01/27 08:02

21^F：→ shasen1235: ，DM的计画向来就不是如何打败人类，而是看AI能不能 01/27 08:02

22^F：→ shasen1235: 找出更好的营运和会战方法，都历经一次AlphaGo了还有 01/27 08:02

23^F：→ shasen1235: 人不知道这个计画在干嘛 01/27 08:02

24^F：推 hankower: 加入模拟滑鼠的操作限制移动速度应该可以防止非人操作 01/27 08:59

25^F：→ jiaching: 希望能公布AI的第一视角VOD 一定很有趣 01/27 09:50

26^F：推 HenryLin123: APM没限制好就是出现这样的AI 01/27 09:51

27^F：推 mrmowmow: ai的目的不是什麽找出新战术好吗？dm的目的是让ai自己学 01/27 11:02

28^F：→ mrmowmow: 习游戏到打败人类，他们才不管你有没有什麽新战术 01/27 11:02

29^F：推 pheather: DeepMind的目的是让AI学会玩这个游戏，然後它们目前学习 01/27 12:31

30^F：→ pheather: 得出的结论是SC2这游戏靠操作。好像也不是很意外？尤其 01/27 12:31

31^F：→ pheather: 是同族对决 01/27 12:31

32^F：推 arrenwu: 其实应该说我们应该要有辅助系统帮助人类处理手速问题 01/27 12:40

33^F：→ arrenwu: 这样这个实验才好继续做下去 01/27 12:40

34^F：→ arrenwu: 因为APM还是其次，AI不可能模仿人类「注意力下降」的部分 01/27 12:41

35^F：推 Adonisy: AI模仿人类的纪律性与战略 01/27 13:32

36^F：推 LochtsStorM: 还在扯手速= = 01/27 19:45

37^F：推 fragmentwing: 有在用智能指令就知道 ai 破千的apm和玩家的意义绝 01/27 21:36

38^F：→ fragmentwing: 对不一样 01/27 21:36

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

StarCraft 板

[情报] DeepMind AI「AlphaStar」

热门看板

赞助商连结