作者pl132 (pl132)
看板Tech_Job
标题[新闻]工程师最大的瓶颈不是写程式,而是审程式
时间Sat May 17 11:41:05 2025
工程师最大的瓶颈不是写程式,而是审程式码!CodeAnt 开发「AI 审核 AI」工具意外获
好评
https://technews.tw/2025/05/17/codeant-ai/
用 AI 生成程式码的「Vibe coding」兴起後,工程师们的工作变轻松了吗?那可不一定
──这些 AI 写出来的程式码,到底谁来负责审核跟确认?
「现在最大的瓶颈,不是写程式,而是审程式码。」CodeAnt AI共同创办人Amartya Jha
这麽说。他们选择不加入写程式AI的红海竞争,而是反其道而行,专做一套帮你审AI写出
来的程式码的工具。
这个切入点,让CodeAnt在2024年初入选矽谷加速器Y Combinator,并拿下200万美元(约
新台币6,072万元)种子轮募资。
AI写程式让工作变快了,却也让错误更难发现
现在许多工程师已经习惯与AI「协作」写程式,这种模式在工程圈被戏称为「Vibe
Coding」。开发者只需输入一段需求描述,AI便能自动生成数十甚至上百行程式码。整个
过程中,工程师不一定需要深入设计逻辑,反而更像是在旁协助、或充当AI的审查员。
CodeAnt观察,现在开发者大约有20~30%的时间都花在Code Review(程式码审查)上,
但大多只是快速浏览。Amartya Jha坦言,「很多时候就是一句Looks good, just merge
it,没有真的看进去」。
而这样的审查流程其实充满漏洞。AI产生的程式码看似无误、语法正确,但里头可能藏有
尚未检查的资安风险、使用了已淘汰的函式库,甚至逻辑设计本身就有问题,只是乍看之
下「能跑就好」。
随着AI产出的程式码比例不断上升,Code Review不再只是交付流程中的例行步骤,而是
决定产品品质与稳定度的最後一道防线。也因此,「谁来审、怎麽审、审得够不够快」,
成了每个开发团队不得不面对的新难题,而这正是CodeAnt决定投入的核心问题。
CodeAnt的护城河:用AI审核AI,以及3万笔自建资料
为了解决开发团队在程式码审查上的难题,CodeAnt打造了一套能真正「看懂」程式逻辑
的AI审查平台。这不只是单纯的语法检查(Linter),而是进一步透过AST(抽象语法树
,Abstract Syntax Tree)技术,把整份程式码拆解成逻辑结构,让AI理解各段程式之间
的关系,并能判断逻辑错误、安全漏洞或命名方式是否合理。
而真正让CodeAnt有别於其他竞品的,是它背後那套超过3万笔的自建规则资料库,涵盖各
种可能的代码提交(code commit)场景。这些不是从开源社群截取来的,而是团队自己
开发、验证过的实战经验。「这是我们的原生IP。」Amartya Jha表示,「我们写了自己
的演算法,理解代码的流程与风险区域,然後针对每种情况提出建议。」
这样的能力,让CodeAnt不只是指出错误,还能提供一键修复(one-click fix)选项,帮
助开发者省下来回讨论、改错的时间,点一下就能直接修改好。整个流程也整合在GitHub
、GitLab等主流开发平台上,当工程师送出修改(Pull Request,即请求合并到主程式码
)时,CodeAnt就会即时跳出协助审查,让错误在上线前就被拦下来。
https://youtu.be/6WZ6GnQRdKI
此外,CodeAnt也支援企业建立自己的客制化规则。像印度最大线上药局Tata 1mg,就在
平台上设定了自家Python开发标准,让AI每次在审查时都能自动对照这些内规进行检查。
这代表CodeAnt不只是「看得懂」程式码,还能「照你家的方式来审」。
与其他AI审查工具相比,例如主打全自动判断的CodeRabbit,或较传统的静态分析工具
SonarSource,CodeAnt的技术核心在於它不只倚赖AI的直觉推论。许多竞品会出现
hallucination(AI幻觉错误)或大量误报,CodeAnt则结合了AI与deterministic rules
(确定性规则),先定好明确的审查底线,再交给AI视情境调整,大幅减少错判与干扰。
也因为这些底层能力,CodeAnt不再只是个「工具」,而成为开发流程中可嵌入、可信赖
的品质守门员。Amartya Jha说得坦白:「工程师现在需要的不是更多AI帮忙写程式,而
是有一套能帮他们守住品质底线的审查员。」
从被拒绝到打入企业市场,正面迎战AI的下一波挑战
CodeAnt能走到今天,其实经历过不少转折。Amartya Jha与Chinmay Bharti在2023年於
Entrepreneur First结识并创业,初次申请Y Combinator还被拒绝。他们没有放弃,而是
录了一支45分钟的影片详细讲解产品逻辑,最终获得再次面试机会,并成功入选。
产品上线後,迅速打入企业市场。他们在2024年初就签下Tata 1mg与Cipla(印度制药巨
头)两家付费客户,证明这不只是demo产品,而是能被真正导入的工具。目前CodeAnt每
月扫描超过5,000万行程式码、修复50万个错误问题,已为开发团队节省超过10万小时的
人工审查时间。
不过,下一步的挑战也已在眼前。
随着GitHub Copilot、Cursor等AI写程式工具功能愈来愈完整,未来势必会内建自己的
Code Review(程式码审查)功能。如果这些写程式的AI开始自己「验自己写的东西」,
外部审查平台如CodeAnt会不会被边缘化?
对此Amartya Jha表示,他们已经开始进一步扩充平台定位,不只是审查错误,也进一步
支援Security(资安)、Compliance(合规)、Audit(稽核)等多面向功能,朝企业级
DevSecOps工具迈进。「我们不是为了补Copilot的缺,而是希望在开发流程中扮演『品质
总管』的角色,真正保障可交付性。」Amartya Jha解释。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 180.177.1.4 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Tech_Job/M.1747453268.A.994.html
1F:推 SFGEX : 只要业务逻辑还不能一键生成,我饭 203.175.14.164 05/17 11:49
2F:→ SFGEX : 碗还在 203.175.14.164 05/17 11:49
3F:→ rodion : 这不就没完没了?谁来审审程式的程式 111.240.96.185 05/17 12:00
4F:推 transistor : 靠人工审查那必死,一定还是自动化 101.12.151.52 05/17 12:16
5F:→ transistor : 打pattern把关 101.12.151.52 05/17 12:16
6F:推 zaiter : 不要code review 就好啦 49.215.85.123 05/17 12:28
7F:嘘 lturtsamuel : 最後一道防线是测试吧 什麽时候审查 49.218.207.78 05/17 12:52
8F:→ lturtsamuel : 变最後一道防线了== 49.218.207.78 05/17 12:52
9F:→ NDark : 现在是工程师PM化时代123.193.163.144 05/17 13:02
10F:→ NDark : 还能配到QA的公司要珍惜123.193.163.144 05/17 13:03
11F:→ angusyu : 这内容有病吗 125.231.27.171 05/17 13:26
12F:推 pujos : 写这篇的都没觉得哪里不太对劲吗 118.231.200.57 05/17 14:20
13F:→ dream1124 : 呃…传统分析工具不就是读取AST吗… 118.167.4.160 05/17 15:06
14F:→ dream1124 : 这个领域不太适合生成式AI, 118.167.4.160 05/17 15:07
15F:→ dream1124 : 而且在我看已经杀到变红海了欸… 118.167.4.160 05/17 15:08
16F:→ dream1124 : 感觉这就举AI大旗拐投资开事业而已 118.167.4.160 05/17 15:08
17F:推 zz3000 : 承认吧 AI根本不知道自己要什麽 223.137.4.212 05/17 15:20
18F:推 dosmark9 : 工程师知道自己要什麽 49.215.58.35 05/17 16:16
19F:推 wulouise : static analyzer+ai也是能圈 42.73.19.7 05/17 16:44
20F:推 Alphaz : 没意义 最後还是要有人去审 审核过 27.51.129.215 05/17 17:36
21F:→ Alphaz : 的程式码 27.51.129.215 05/17 17:36
22F:推 EraKing : 创办人是印度仔,持保留态度 49.215.157.144 05/17 18:02
23F:推 alittleghost: AI审AI啊 1.34.234.130 05/17 18:26
24F:推 FXW11314 : 开发审审ai code 的ai的ai有搞头吗 42.73.11.201 05/17 19:09
25F:推 velaro : 记得上次merge 完後飞机就撞墙了 1.164.246.24 05/17 20:53
26F:推 bitcch : 超过3万笔的自建规则资料库... 49.216.174.187 05/17 21:22
27F:推 cassetoi : 都vibe coding了还审什麽 123.193.128.96 05/17 21:28
28F:推 bunjie : 开发能够自己多重审查自己的程式 182.155.197.16 05/17 22:19
29F:→ bunjie : 这样就万无一失了 递回的概念 182.155.197.16 05/17 22:19
30F:→ MTKer5566 : 可怜,创投就这样被骗了200万镁, 42.70.101.84 05/17 22:50
31F:→ MTKer5566 : 这题目我2年前就想过了根本不可行 42.70.101.84 05/17 22:50
32F:→ MTKer5566 : 叠一层AI有意义而已,无穷无尽的AI 42.70.101.84 05/17 22:51
33F:→ MTKer5566 : 审AI就是在骗钱 42.70.101.84 05/17 22:51
34F:→ wju1230 : 这公司中文名是码蚁吗 XDDDD 61.223.248.61 05/17 23:35
35F:推 krizarlid : 底层一堆鬼架构外加 racing condit 42.72.39.177 05/18 10:05
36F:→ krizarlid : ions 最好可以抓 42.72.39.177 05/18 10:05
37F:推 dongdong0405: 连仅存的审查工作也要被取代了吗 101.12.144.65 05/18 12:03
38F:→ yunf : 之前就说了有人还说不可能 49.218.141.149 05/20 02:34
39F:→ yunf : 这一步超重要 49.218.141.149 05/20 02:35
40F:→ yunf : 一层一层进步 49.218.141.149 05/20 02:36
41F:推 Falldog : Vibe Review -> Vibe Debug -> ... 36.224.175.124 05/24 20:41