作者PosetMage (AI魔法师公会长老)
看板GameDesign
标题[鲁蛇] 从AI训练思维来看游戏平衡这件事
时间Tue Apr 11 20:20:45 2023
如果要训练AI当策略游戏的平衡还有拿来当AI的思维:
先分类型
规则多的或者
数值多的
规则多的基本上必须以decision tree为主的方式去设计AI
数值多的话则很好套用hidden layer的概念
当然是建议规则类型能减少就减少,毕竟越多规则会造成复杂的程式码
魔法风云会就是
规则多 然後多到还有官方出被自己方官方禁卡的智障行为
写成程式当然也是超级麻烦
训练过程可以定义方向会方便很多,比如战棋或者卡牌或者RTS有"胜负"
因为可以定义胜负了,所以可以采用强化学习(Reinforcement learning)去让AI左右互搏
学到一定程度之後,检查"
strategy space" 和 "
strategic depth"
如果
Strategy Space太小就是平衡太差,
好的平衡就是尽可能扩大
Strategy Space 从这个定义可以看出训练上的困难,
因为AI训练是要找一个最好可以
收敛的方向,比如胜率最终双方会趋於50:50
(一般来说通常有先发优势,可能是55:45,举例来说,麻将就是25:25:25:25,四个高手
一起打就是平均值在平手。)
问题是我们想要并不是一个
收敛的结果,而是尽可能
发散的Strategy Space。
反向传播(Backpropagation)训练AI是只能往收敛走,无法往发散走的。
从AI概念可以推论出真把平衡做好的很难
玩游戏也可以看出这种天生的非对称性:
策略游戏玩家经常可以找到较好的策略,甚至因为某几招特别好用,大家都用同一招了
策略游戏制作团队却难以找到好的平衡,
比如Blizzard遇到平衡问题,就是先nerf再说"我们觉得这样很cool。"
--
DC群-
AI魔法师公会(AIMageGuild) 欢迎你的加入 (请看个人资讯)
一起来聊AI的各方面包含 AI硬体 AI演算法 AI思维 AI咒语 使用AI生产
AI打牌下棋的思维 後AI时代的商业模式 都可以聊
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 126.119.53.227 (日本)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/GameDesign/M.1681215649.A.EA0.html
※ 编辑: PosetMage (126.119.53.227 日本), 04/11/2023 20:23:44
1F:推 MrFishing: 推荐这位来自日本的魔法师大大(欸? 04/12 10:21
2F:推 tsrn46336686: 谢谢大大分享 但感觉好像没什麽重点@@ 04/12 22:02
3F:→ strangechu: 这笔记文体不知道你重点是什麽 总之想表达平衡很难? 04/13 11:04
谢谢你的提问 我在定义什麽是"平衡"
大家都说平衡不好 那什麽是"平衡"?
一般人直觉是不同种族不能有太大的胜率落差 但同种族之间呢?
某些技能招式组合太imba就是不平衡?
那同种族之间组合数量也相当多 要怎麽说是你个人不会玩还是不平衡?
用"Strategy Space"是否可以作为一个可以统一这些问题的定义
Strategy Space要如何作为检验方式? 因为可能是你技术太差才以为其他组合不好用
AlphaStar用神族追猎者可以打爆人类不朽者 那是谁的问题? 平衡又要怎麽做才合理?
所以引入了用AI去训练的概念 AI大量探索後
"AI找到的Strategy Space"才是"平衡度"
那现在有平衡度的定义了 要如何用电脑自动去寻找平衡度?
用神经网路AI? 很抱歉不行 因为神经网路只能找收敛无法找发散
那有没有其他方法? 我个人猜"演化式计算"(基因演算法)反而有可能
让"AI找到的Strategy Space"大的数值集合 去做杂交演化下一批数值
※ 编辑: PosetMage (123.218.12.230 日本), 04/13/2023 12:29:35
4F:→ Mchord: generative model也是BP训练喔 04/14 12:26
5F:→ Mchord: 如何找得到的metric去定义strategy space才是问题 04/14 12:27
6F:→ ddavid: 制作团队不是比玩家难找到平衡,而是不值得花费那个成本 04/16 16:39
7F:→ ddavid: 在处理平衡问题前,最先要理解的是当你系统有一定的复杂性 04/16 16:40
8F:→ ddavid: 後基本上就不用考虑可以完美平衡了 04/16 16:40
9F:→ ddavid: 因为做不到,玩家也未必需要 04/16 16:41
玩家未必需要那为甚麽MTG需要禁卡?
RTS不需要平衡的话 那bz在nerf甚麽? 放着就好
10F:→ ddavid: 其他有些我以前本版老文章有聊到XD #1CGrc99x 04/16 16:41
11F:→ ddavid: 至於你讲 AI 一堆似是而非的内容,就不一一谈了……XD 04/16 16:44
你的文章问题是没有定义什麽是完美的平衡(也没定义平衡) 反而在用乌贼战术打模糊战
你的文章说玩家算不完 算不完又怎样 用期望和机率算就好
很显然你对现代AI完全没有概念 ex: 扑克AI、麻将AI都是在打机率而不是传统决策展开
我在这篇就是在定义平衡是 "AI探访过後的Strategy Sapce"
12F:→ ddavid: 老实说类神经网路已经可以用相对便宜价格建立到一个程度时 04/16 16:46
现在神经网路多半是拿来找方法 ex:AI下棋 AI打星海
都不是拿AI来调整数值做平衡
我在讨论的是用AI做平衡
13F:→ ddavid: ,基因演算法这种口头上演化讲得很有噱头,实质上其实还是 04/16 16:47
14F:→ ddavid: 一种搜寻演算法的东西能使用的范围就已经极度减少了 04/16 16:48
我在提就是Backpropagation只能找收敛而非找发散
我本身就是在做AI的(使用演算法到硬体指令做晶片加速都有) 如果你懂AI 欢迎讨论^^
※ 编辑: PosetMage (60.115.80.231 日本), 04/17/2023 14:11:30
15F:推 cutearia: GA的问题一样是後期收敛时大部分染色体解都相同,不觉 04/25 00:04
16F:→ cutearia: 得效果会比类神经网路好。怎麽把你说的strategy space 04/25 00:04
17F:→ cutearia: 大小转换成reward/fitness来训练可能会有比较直接的效 04/25 00:04
18F:→ cutearia: 果 04/25 00:04