Soft_Job 板


LINE

※ 引述《pacino (扫地僧)》之铭言: : 看了这两串, 充满了疑问.. : 想讨论一下这个主题: token : (1) 每个LLM 都有自己的max. tokens : 这是在training model时就要决定的 : (2) max output tokens是让agent在送给LLM 之前处理用的,避免超过LLM model的max. to : (3) rules 没被执行,有可能是context可能超过LLM model的max. tokens, agent 主动压? : 这样不就解释了两串原po的问题? : 麻烦指正,若我的了解有误。 CLAUDE_CODE_MAX_OUTPUT_TOKENS 用途:用来指定LLM单次最多回答多少tokens。 但这个长度控制,不是由LLM或agent来控制的。 也不是放在prompt给LLM做推理判断长度的。 LLM只是一堆权重与计算。 不是真正有action的程式,不会自己决定输出长度。只会被动的等待输入,计算输出。 LLM会停止输出,全部是靠写死的程式码控制。 (非AI自己决定停止) 以下举几个例子: 1.正常情况: 没用满模型token最大长度限制,就得到答案。 机制如下: 应用层的model serving 程式码 (例如用vllm假设) 看到LLM这是是输出 EOS (end-of-sentence) token。 tokens,停止继续使用LLM推理。 决定停止推理下一个token的不是LLM 而是应用层,程式码码写死:看到了各模型输出了特殊的EOS,请应用层停止再使用LLM。 对模型来说,输出EOS是没特殊意义的, 就是机率+ decoding strategy决定的。 LLM不会因为输出EOS有什麽行动。 赋予EOS要停止使用LLM的是应用层。 简单说:停止答案继续输出,的绝对不是LLM自己决定的。 2. 模型一直输出,但输出太长了还是没算出答案 也就是一直输出,但没算出EOS token。 这种情况,也不是LLM在控制长度, 而是应用层在处理太长的问题。 这分成两种情况: 1. model serving层有做防呆机制,发现长度太长了,所以直接不使用llm产生next token,是回传讯息到上一层讯息,让上一层决定怎麽处理。 (大家看到市面上产品,都是走这种方式) 所以会看到 claude产品会输出提示讯息。 所以,长度控制,也不是LLM决定的,是应用层model serving决定的。也可以说人去设定的。 2. 没做防呆机制,直接丢过长的文字(或tensor)给LLM去推理。这是也是看推理层程式码有没有防呆,例如,如果是走pytorch,就是直接跳error程长度不一致,直接结束process。 长度不符,根本进不去,LLM做计算。 以上所有情况可发现: LLM本身不决定输出长度,全部是其他应用层决定的。 硬要扯:LLM会自己决定输出EOS,要求停止。 这也是观念错误,EOS对LLM没有特殊意义。 EOS是应用层赋予的意义。 你也可以写成看到EOS不要停止的问答系统。 (许多model serving tools都可以改EOS) 最後回答最初那篇: 64K输出长度限制都没终结答案。 也输出过程大概都超过 3000行文字或程式码了。 通常有两种改善方向: 1. prompt要更明确,缩减范围。 2.把复杂任务,拆小一点,每个session解决一个小问题。 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 27.247.193.27 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1772900896.A.06D.html
1F:推 umum29: 感谢分享运作逻辑 除了工具运用外 其实了解底层运作很重要 03/08 00:50
2F:推 viper9709: 感谢分享 03/08 01:33
3F:推 nicetw20xx: 谢谢分享 03/08 12:51
4F:推 leicheong: 这篇感觉是公司正在尝试的方向. 现在写prompt会提交给 03/09 06:35
5F:→ leicheong: 第一层AI批核, 不达到要求的具体程度不给过. 之後有 03/09 06:36
6F:→ leicheong: 其他AI做分工拆细作业再传到本来的AI去实作的样子 03/09 06:38
7F:→ pacino: 真是厉害,ChatGPT跟gemini 都在乱扯!问「EOS是什麽?谁 03/09 07:50
8F:→ pacino: 产生的?」就发现这两只在乱扯。 03/09 07:50
9F:推 sssyoyo: 推 03/09 17:25







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:WOW站内搜寻

TOP