作者oopFoo (3d)
看板Soft_Job
标题Re: [心得] AI的人性
时间Tue Apr 7 03:06:40 2026
二月後,anthropics改了一些东东
https://news.ycombinator.com/item?id=47664442
adaptive thinking default (Feb 9)
Medium effort (85) default on Opus 4.6 (Mar 3)
事情闹大是因为
https://github.com/anthropics/claude-code/issues/42796
说Claude变很笨,这段时间写的codes现在正在靠Codex5.4重新改写。
写issue的人说,那些defaults都改过,还是一样笨。八点档继续演
※ 引述《cateran (云川闲步)》之铭言:
: 最近工作上解一个问题用opus 4.6发生一个快让我笑死的状况
: 背景是本公司巨大的c++应用程式在某个情况下crash
: 喂log请AI检查後很快就查查资料改好一版
: 说是因为某某某情况所以本来的map找不到查询的指标
: 回传一个out of bound的index value
: 新程式新增了一段进阶检查的回圈应对特殊状况
: 改好後跑原本测资还是crash
: 把log喂回AI请他再看看
: 结果第二版竟然把之前的修改全部拿掉
: 只在上层呼叫端加一个fallback说指标找不到就直接回传0
: 还沾沾自喜跟我说 阿这样就绝对不会crash了 很棒吧
: 我只好质问agent 阿你这样只是把问题掩盖住 这样对吗?
: AI也毫不掩饰的说 你说得没错 我不该这样
: 最後AI给出的第三版总算把问题从底层修好
: 不禁在想第二版那种天兵解法的思路到底是怎麽出来的
: 是因为训练资料也包含一些菜鸟工程师的程式吗
: 有没有AI大神可以解释这种状况
你确定有改好?其实埋了更多炸弹?
news.ycombinator 那篇很精彩,一堆人事後诸葛说我也发现Claude变笨了,然後一推人说reddit早就吵翻了。
其实还满惨烈的。这麽多人用的ai,变笨,使用的人埋了一堆炸弹,现在要如何拆弹?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 58.114.66.74 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1775502407.A.F76.html
1F:推 jobintan: 往好的方向思考,这是给人类工程师制造机会,给想着用A 04/07 07:43
2F:→ jobintan: I去人类的惯老板们赏一巴掌。wwwww 04/07 07:43
短期内还是蛮悲观的。亚马的90-day reset,没有造成震撼,看来每个惯老板要自己学到教训。
3F:推 yamakazi: 装笨让你优越感一下 04/07 10:36
4F:→ Obama19: 有新模型快出来都会变笨 都演几次了 04/07 10:40
5F:推 yamakazi: 就跟新手机新晶片新的方案出发出发之前,旧的偷降速降频 04/07 10:44
6F:→ yamakazi: 一样,挤牙膏 04/07 10:44
7F:→ freeunixer: 还好我前两个月都在打混没用 ai (~误 04/07 13:20
8F:推 sarsman: 说到底不就没在review才导致这样== 04/07 13:25
9F:嘘 USD5566: 重点不是笨不笨 而是你们是工程师然後居然跟一般人一样 04/07 15:35
10F:→ USD5566: 在讨论语言模型根本不存在的人格人性zzzzz 拜托这个板是 04/07 15:35
11F:→ USD5566: 认真的吗 04/07 15:35
就像根本没有thinking/reasoning模式,ai公司也一直重复。明明就是增加tokens来达成增加搜寻范围来找到更适合的答案。
12F:推 zxc8787: 楼上说的有道理== 04/07 15:54
13F:→ peterturtle: 我们还在机台上放乖乖呢,讨论个人格人性怎麽了 www 04/07 17:54
14F:推 ManInBlack: 把物体拟人化确实是有帮助大家了解抽象的东西啦 04/07 18:54
15F:→ ManInBlack: 一本正经胡说/取悦使用者/降低思考强强度真的蛮「人」 04/07 18:55
16F:→ ManInBlack: 的XD 04/07 18:55
17F:推 yamakazi: 这不是脑补Karpathy用自动补全不是用agent的原Po吗? 04/07 21:05
18F:推 yamakazi: 之前还脑补使用claude code只是下prompt不是用agent 04/07 21:08
19F:→ yamakazi: 把claude code想成下prompt和自动补全 04/07 21:09
20F:推 abccbaandy: 笨不笨难说,但Opus确实贵... 04/07 21:18
21F:→ superpandal: 对於工程师而言本来就有更适合的工具 除非本来就不会 04/07 22:32
22F:→ superpandal: 把这类工具当浮木的才会一直吹 效率工具本身也是工程 04/07 22:33
23F:→ superpandal: 师私有远控CP值才高 04/07 22:34
24F:→ superpandal: 我现在还要加一个别人永远看不懂的操作才安全 即便从 04/07 22:39
25F:→ superpandal: 椅背後看 04/07 22:39
llms当成辅助,其实还不错。但现在的用法太勉强了
※ 编辑: oopFoo (58.114.66.74 台湾), 04/08/2026 08:09:46