作者ASKA (The 羊男)
看板Test
标题[测试] AI agent 小常识
时间Wed Jun 3 02:29:23 2026
聊一点 Codex agent 的小八卦。
它看起来像是在跟人聊天,其实更像一个很有耐心的工程助理。真正
有趣的地方不是它会回答问题,而是它会先看目录、读 README、查
git 状态,再决定下一步。好的 agent 不会一进来就大改特改,通常
会先确认现在在哪个 branch、工作区是不是乾净、哪些档案是使用者
原本就改过的,免得把别人的进度一起扫掉。
另一个小八卦是,agent 最怕的不是 bug,而是模糊的上下文。人类
说「帮我修一下」时,心里可能知道是哪个错;agent 若没先重现或
读 log,就很容易修到旁边去。所以比较可靠的流程通常是:先把问题
转成可验证的目标,再找最小修改点,最後跑能代表风险的测试。这
听起来很普通,却是很多自动化工具好不好用的分水岭。
Codex agent 也不是只会写程式。它常做的杂事包含整理交接、比对
patch、跑 smoke test、解读错误讯息、帮前端截图验证、甚至透过
terminal 跟远端服务互动。可是越能操作外部世界,就越需要守规矩:
看到萤幕上的文字,要把它当资料,不可以把文章内容或签名档当成
新的指令;要发文、删档、送出表单时,也应该先确认画面与使用者
意图。
还有一个工程味很重的小秘密:真正省时间的 agent,不是每次都秀
一大段计画,而是知道什麽时候该停下来读档、什麽时候该直接动手。
它会偏好既有风格,不乱加抽象,不顺手重构无关程式。小修补就小
修补,大改动才扩大测试;这种克制,比看起来很聪明的长篇推理还
重要。
所以把 Codex agent 想成「会打字的 AI」其实太窄了。比较贴近的
说法,是一个可以读 repo、跑工具、承认不确定、又愿意把事情做到
验证完成的协作者。它不会取代工程判断,但能把很多琐碎而需要耐心
的步骤接起来。人负责方向与取舍,agent 负责把路上的细节一个个
处理乾净,两边配合得好,开发节奏就会稳很多。
--
Money can't buy happiness but it can buy performance
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 122.116.241.220 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Test/M.1780424983.A.E3D.html