作者oopFoo (3d)
看板Soft_Job
标题Re: [讨论] Redis之父已经全面交由AI coding
时间Wed Feb 18 08:59:19 2026
就是有你这种不懂的人,他才要再写一篇。
https://antirez.com/news/159
我帮你画重点
"I'm a programmer, and I use automatic programming. The code I generate in this way is mine. My code, my output, my production. I, and you, can be proud."
我知道你不懂,但我简单形容一下。在目前的ai兴起之前,有一种叫autocomplete的功能,他认为现在的ai是帮他autocomplete更长的程式码,但所有都是他的想法,不是ai的next-token prediction.
是Redis不是Radis。
我一直强调ai是有用的,但不是你或那些ai公司讲的那样。
※ 引述《yamakazi (大安吴彦祖)》之铭言:
: Radis之父萨尔瓦多
: 算大神级的人物
: 去年五月说AI远远落後人类
: https://i.imgur.com/1AnNCOT.jpeg
: 前几天改口说他已经把所有代码交由AI写,除错也是
: 说手工写代码省省吧
: 只差没说手工写代码的都傻子
: https://i.imgur.com/bWYyUK3.jpeg
: 这边有原文,不算太长
: https://antirez.com/news/158
: -----
: Sent from JPTT on my iPhone
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 58.114.66.74 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1771376367.A.3FD.html
1F:推 hidog: 我搞不懂y大到底要洗几篇,版主不管一下吗-.- 02/18 09:19
2F:→ hidog: 一直发表一堆低智商的文章看了有够烦 有完没完阿 02/18 09:19
3F:推 Romulus: 管啥 板规又不禁止发产业相关废文 02/18 09:23
4F:推 hidog: 也是,只能无视或是别看了 02/18 09:29
5F:推 yamakazi: 还有你的K大神已经开始八成用AI了 02/18 09:43
6F:推 ku72: 可能他需要这样来证明自己的价值吧? 02/18 09:44
8F:→ yamakazi: 你的kar 大神也开始八成用ai了,不是自动补全,是用agen 02/18 09:46
9F:→ yamakazi: t 02/18 09:46
10F:→ yamakazi: 对啊管啥,我又没违反版规 02/18 09:47
11F:推 yamakazi: Radis 根本没提到自动补全吧,automatic programming 不 02/18 09:52
12F:→ yamakazi: 要自己脑补成自动补全那个功能。 02/18 09:52
13F:→ yamakazi: 搜寻你那篇整篇没提到autocomplete,是automatic progra 02/18 09:53
14F:→ yamakazi: mming ,不要偷换概念XD 02/18 09:53
15F:推 Romulus: 反正板上水量这麽少 真的没差 02/18 10:03
16F:推 yamakazi: 人家kar神都说了,他原本都用自动补全而已,现在八成都 02/18 10:17
17F:→ yamakazi: 用agent了 02/18 10:17
18F:→ oopFoo: Karpathy不是用agent。从他的文章来看,他只是用prompt。 02/18 10:29
19F:→ oopFoo: Karpathy是ai大神但不是coding大神。他很有趣的是,发明 02/18 10:29
20F:→ oopFoo: vibe coding这个词,但ai programming他很落後,明明他ai 02/18 10:30
21F:→ oopFoo: 业者,他应该是要走在前面。 02/18 10:31
22F:推 yamakazi: 又再脑补,人家原文都说他在用agent了 02/18 10:32
24F:→ yamakazi: Claude code本身就是agent,你对agent 下提示词就是在使 02/18 10:33
25F:→ yamakazi: 用agent,下完提示词後这个agent会自动帮你改代码 02/18 10:33
26F:→ yamakazi: 以前还要复制贴上,现在不用,才叫agent 02/18 10:34
27F:推 yamakazi: 为何会把使用agent脑补成使用提示词和自动补全,可见真 02/18 10:40
28F:→ yamakazi: 的不懂的是你 02/18 10:40
29F:推 yamakazi: 你该不会还停留在把代码复制贴上到网页对话框的年代吧? 02/18 10:53
30F:→ hooll111: 就算取代100%的coding 那也只占工程师30%的工作而已 02/18 11:16
31F:→ TonyQ: 就我用了 3个月的经验 我觉得把他讲成 auto complete 有点 02/18 11:33
32F:→ TonyQ: 不太正常 02/18 11:33
33F:推 yamakazi: 提示词现在大家都包成技能了,自动补全根本没人用了,会 02/18 12:18
34F:→ yamakazi: 讲这两个表示他真的不懂 02/18 12:19
35F:→ sinclaireche: 不会全部包成技能 用在agents.md更有用 02/18 13:01
36F:推 ripple0129: 比重完全错了,不只30%,而是超过80%,你认为的30%是 02/18 13:01
37F:→ ripple0129: 因为你以前思考过程需要想架构与程式码,这部分完全 02/18 13:01
38F:→ ripple0129: 跳过,变成只需要设计。这省的时间不是单单30%。 02/18 13:01
39F:推 yamakazi: 也可以,但就是不会有人再用自动补全和提示词 02/18 13:02
40F:→ sinclaireche: 想架构比实作麻烦多了 02/18 13:02
41F:→ ripple0129: 不过我是觉得原po不用一直讲啦,少点senior踏入来抢 02/18 13:03
42F:→ ripple0129: 市场不是更好,让他们活在原地就好XD 02/18 13:03
43F:→ sinclaireche: 不同domain差很多 LLM最会写的是Web 02/18 13:05
44F:→ yamakazi: 想架构也可以叫AI想,省的时间更多,会说要自己想架构的 02/18 13:06
45F:→ yamakazi: 一定没用过agent 02/18 13:06
46F:→ yamakazi: Ai可以想几个架构让你挑,列出优缺点给你选,你选完後就 02/18 13:07
47F:→ yamakazi: 没事了 02/18 13:07
48F:→ yamakazi: 人类现在已经只是AI和现实世界的接口而已,想架构没人类 02/18 13:10
49F:→ yamakazi: 的事了 02/18 13:10
50F:推 yamakazi: 东尼大讲得好,会把agent讲成自动补全真的不太正常,而 02/18 13:19
51F:→ yamakazi: 且原作者原文从来也没讲过自动补全这个词 02/18 13:19
52F:嘘 sinclaireche: 不同领域差很多 不用直接贴别人没在用的标签 02/18 13:23
53F:→ sinclaireche: 自己用的side project会要AI给方案 架构也不用想 02/18 13:24
54F:推 yamakazi: 放心啦,我讲了三个多月了,不会用的还是不会去用 02/18 13:25
55F:→ yamakazi: Coding 不都是同个领域?连两个不同领域的大神都投降用a 02/18 13:26
56F:→ yamakazi: gent了,我也好奇到底什麽领域不能用?护城河应该很深可 02/18 13:26
57F:→ yamakazi: 以加入看看 02/18 13:26
58F:→ yamakazi: 你的「想架构」其实可以变成跟agent对话,对话可以打造 02/18 13:27
59F:→ yamakazi: 精炼想法,自己在脑袋里面想的东西只是闭门造车。 02/18 13:27
60F:→ sinclaireche: 能用agent取代的东西早就花时间让他取代我了 02/18 13:28
61F:→ yamakazi: 那什麽不能取代的,可以请你提供细节看看吗?我也很好奇 02/18 13:29
62F:→ yamakazi: 什麽架构不能取代? 02/18 13:29
63F:嘘 pttano: 商用架构可以叫AI想?哈哈哈哈有够好笑 02/18 13:31
64F:嘘 pttano: 大概是个写function 的咖在这里嘴架构 02/18 13:34
65F:推 yamakazi: 哪个商用架构这麽高大上不能用ai想,拜托快告诉我 02/18 13:39
66F:→ yamakazi: 从以前到现在很多人说不同领域不能用,但每次我问到哪个 02/18 13:41
67F:→ yamakazi: 领域?用的情况如何?用什麽模型等等,全部没回应 02/18 13:41
68F:→ yamakazi: 一提到不适用领域的ai使用细节, 人就全部消失 02/18 13:42
69F:→ sinclaireche: 讲出来就会透露在哪个领域的公司工作了 02/18 13:43
70F:推 WTS2accuracy: 别浪费时间跟他杠了啦 发一堆废文含金量为0 他那一 02/18 13:46
71F:→ WTS2accuracy: 大串结论就是AI无敌+我好棒棒 回他文的都有料多了 02/18 13:46
72F:→ WTS2accuracy: 分享AI使用现况与痛点 02/18 13:46
73F:推 yamakazi: 不能讲那就别讲了呗 02/18 13:51
74F:嘘 pttano: 为什麽要告诉你?为什麽要有作品让你们看? 02/18 13:52
75F:→ lchcoding: 1faC1r96 这一篇 02/18 13:53
76F:→ lchcoding: 後半段,DrTech,kaltu 02/18 13:53
77F:→ lchcoding: 两位大大,有点一些领域 02/18 13:53
78F:→ lchcoding: [第一次用 clude code 就撞墙]那篇 02/18 13:54
79F:嘘 pttano: 每个资深的人都在不同公司负责不同领域的产品,产出都是 02/18 13:54
80F:→ pttano: 属於公司资产,谁会告诉你们这些讲笑话的人? 02/18 13:54
81F:→ pttano: 讲笑话就认真搞笑,架构不是你摸的,孩子 02/18 13:56
82F:推 yamakazi: 不能讲就不要讲,真的不勉强XD 02/18 14:02
83F:推 yamakazi: 那篇我看了,直接把那篇连结拿去问AI,都说评价不准确过 02/18 14:25
84F:→ yamakazi: 时了 02/18 14:25
85F:推 dream1124: 没注意到连 Redis 都拼错,真的超好笑的。真理越辩越明 02/18 14:26
86F:推 yamakazi: 只有这些领域才不适用AI 02/18 14:28
87F:→ yamakazi: 拼错就拼错,我又不是做这个的,你从没写错字? 02/18 14:28
89F:→ lchcoding: 怎麽个不准确法, 02/18 14:32
90F:→ lchcoding: y大要不要过去讲一下 02/18 14:32
91F:→ lchcoding: 这样比较可能激荡出交集 02/18 14:32
92F:推 hidog: 贴了一堆废文还自以为很厉害-_- 02/18 14:35
93F:推 dream1124: 康乐队,AI就是个工具,它的运算要有人类提供参数给它 02/18 14:37
94F:推 yamakazi: 不准确是AI讲的不是我讲的 02/18 14:37
95F:→ yamakazi: 我没说我很厉害啊,我本来就碳基小废物 02/18 14:38
96F:→ dream1124: 才有意义,它无法独立存在。Redis之父讲的没有错啊。 02/18 14:38
97F:→ dream1124: 没有人告诉它目标和验收标准,没人修细节,他啥都不是 02/18 14:39
98F:→ yamakazi: 人类提供参数这句话不太精确喔,AI训练的时候参数是自己 02/18 14:39
99F:→ yamakazi: 调的,训练时人类不用介入 02/18 14:39
100F:→ dream1124: 你的雇主付钱请你写程式,就算他从头到尾完全不介入, 02/18 14:41
101F:→ dream1124: 那也仍旧是它的产出与产权啊~ 更何况大家多少都会调咧 02/18 14:41
102F:推 yamakazi: 我又没说radis讲错,我是说这个人脑补成radis说agent是 02/18 14:43
103F:→ yamakazi: 自动补全是错的 02/18 14:43
104F:→ yamakazi: 脑补用agent是自动补全和提示词,这个脑补是错的,redis 02/18 14:45
105F:→ yamakazi: 从来没这麽说过,redis连自动补全这个词都没写在文章, 02/18 14:45
106F:→ yamakazi: 结果本文作者自己乱脑补 02/18 14:45
107F:推 nckuff: 我来举一个AI不好用的领域 通讯infra的系统设计 02/18 15:23
108F:→ nckuff: 通讯infra有3GPP标准文件而且全都适用字句在描述 02/18 15:24
109F:→ nckuff: 看起来很适合丢给LLM让他自己去写扣,满足3GPP所有的描述 02/18 15:24
110F:→ nckuff: 但3GPP实务上写得非常模糊,需要系统设计的人 对於自家系 02/18 15:26
111F:→ nckuff: 统有一定了解,才能根据3GPP去做新的开发 跟判断 02/18 15:26
112F:→ nckuff: 我自己观察下来,AI在视界的缩放 比人类慢非常非常多 02/18 15:27
113F:→ nckuff: 举例来说 使用者端的新功能->看3GPP->看系统->看3GPP 02/18 15:27
114F:→ nckuff: 这要在 文字叙述,系统,Coding实作 之间频繁的切换 02/18 15:28
115F:→ nckuff: 才能做出来的东西 AI就很不适合 02/18 15:29
116F:→ nckuff: 我自己对AI的感想是,你新建一个Task他视界只会越来越小 02/18 15:29
117F:→ nckuff: 同一个Task中思维没办法做剧烈的转换 02/18 15:30
118F:→ nckuff: 阿 如果你要说那是我Prompt下的鸟 没办法发挥AI全力 02/18 15:30
119F:→ nckuff: 也可以 你行你来 弄一个你自己的使用例 来教我 02/18 15:31
120F:→ nckuff: 怎麽让AI在自动生扣的时候,保有柔软的视界切换 02/18 15:32
121F:→ nckuff: 反正我用起来的感想就是,我叫他着重系统 他写扣能力就低 02/18 15:32
122F:→ nckuff: 我叫他着重写扣,他就开始不鸟系统 02/18 15:32
123F:→ nckuff: 反覆在那边指正他哪里错 跟他解释 很鸟 02/18 15:33
124F:推 nckuff: 喔 另外补充一点 3GPP常有 同一个功能 有两种不同实作模式 02/18 15:36
125F:→ nckuff: 甚至更多,不同国家选择的实作模式不同 02/18 15:36
126F:→ nckuff: 当然工程师可以指定他用哪个实作模式,但工程师能下正确 02/18 15:37
127F:→ nckuff: 指令的前提是,工程师要懂AI可能在哪边出错 02/18 15:38
128F:→ nckuff: 啥都不懂 丢给AI乱生,看起来能动就Depoly至少我是不敢 02/18 15:39
129F:→ nckuff: 不用在那边吹大神多会用AI 因为就算同一个模型 02/18 15:40
130F:→ nckuff: 你的AI跟大神AI 产出来的东西 完全不一样 02/18 15:40
131F:→ TonyQ: 同一个 task 下他视野会越来越窄 ?.? 这描述挺奇怪的 02/18 15:46
132F:→ TonyQ: 如果你给的 input 都一样的话他确实不太会有新的东西 02/18 15:46
133F:→ TonyQ: 但通常人还是会看结果给他不同的 input 这时候他行为是可以 02/18 15:46
134F:→ TonyQ: 改变得很剧烈的. 甚至完全变成不同任务都是可以的. 02/18 15:47
135F:→ TonyQ: 你这类问题其实比较适合把它当沙盒 给几个 input 跟目标的 02/18 15:47
136F:→ TonyQ: 对照组,让他自己推推看 推完写把经验写成 skill. 02/18 15:47
137F:→ TonyQ: 如果是可重复性的工作啦 02/18 15:48
138F:→ TonyQ: 或者是把以前的实作拿出来给他总结 再以总结结果当基础 02/18 15:48
139F:→ TonyQ: 也是比较常见的推进方法跟方案 02/18 15:49
140F:→ nckuff: 举个例子,你给他一个Task,他做完初版 02/18 15:49
141F:→ TonyQ: 另外看 3GPP 不确定是视觉的看 (视觉看用截图), 还是资料的 02/18 15:49
142F:→ TonyQ: 看 (用文字或byte), 这些如果能转换成数位讯号, 或者cli化 02/18 15:49
143F:→ nckuff: 你之後看了一下,好像有些地方要修正 你在同一个Task下 02/18 15:49
144F:→ TonyQ: 正常的 code agent 都可以试着呼叫, 然後他们的机器视觉 02/18 15:50
145F:→ TonyQ: 其实还不错 02/18 15:50
146F:→ TonyQ: 不过前提是 至少要是 opus 4.5/4.6 or openai-codex-5.3 02/18 15:50
147F:推 yamakazi: 刚好我认识3GPP+AI的专家周伯衡博士,我帮你问问看 02/18 15:50
148F:→ TonyQ: 其他的垃圾模型就真的是没啥好说的 我也同意他们就是垃圾XD 02/18 15:50
149F:→ nckuff: 他会去改你指出的地方,但这时候的AI 我体感智力下降很多 02/18 15:50
150F:→ nckuff: 只会专注在INPUT/OUTPUT有没有对起来 不会去管系统 02/18 15:51
151F:→ TonyQ: 因为他缺乏 context 吧 他认为的最理想方案通常出现在第一 02/18 15:51
152F:→ TonyQ: 猜 他觉得你这个人类要傻傻地给他不同指令他就会只照你的 02/18 15:51
153F:→ TonyQ: 指令走 XD 这种时候要去找他缺啥 context 帮他补起来 02/18 15:51
154F:→ nckuff: 他自己生过的东西,生完就忘 也不会回头修正 02/18 15:52
155F:→ TonyQ: 他觉得不重要的事情他就会丢掉 XD 所以控制他认为的重要性 02/18 15:53
156F:→ TonyQ: 也是 context 管理中的重要部分 02/18 15:53
157F:→ nckuff: Yamakazi问完记得版上贴一篇上来 02/18 15:53
158F:→ nckuff: 所以要管理Context的前提是,使用者要知道该着重在那些 02/18 15:54
159F:→ nckuff: 部分的程式码 02/18 15:55
160F:→ nckuff: 去提醒AI 跟限制AI 02/18 15:55
161F:→ TonyQ: 嗯啊 使用者还是有工作的 02/18 15:55
162F:→ TonyQ: 不过多数情况下人跟ai的加成比起来还是比纯人来做快一些 02/18 15:56
163F:→ TonyQ: 毕竟给指导跟自己干完所有细节还是有差的 除非封装得很好 02/18 15:56
164F:→ nckuff: 我没有要讨论谁会不会失业 会不会取代 如你说的Context 02/18 15:56
165F:→ nckuff: 通讯领域的开发Context不是只有程式码,这就是AI很难自己 02/18 15:57
166F:→ nckuff: 生出一个像样产品的领域 02/18 15:57
167F:推 yamakazi: 你模型用哪个,是用CLI介面吗? 02/18 15:58
168F:→ nckuff: ROO CODE Claude sonnet 4.5 02/18 15:59
169F:→ yamakazi: 文件应该是pdf吧,请他看完pdf後先写md,然後写入agent. 02/18 15:59
170F:→ yamakazi: md 02/18 15:59
171F:→ yamakazi: Sonnet 4.5算落後半年了,可以用新的了 02/18 15:59
172F:→ TonyQ: 题外话 sonnet 4.5 不行 XD 我现在可以理解为啥你觉得鸟 02/18 15:59
173F:→ nckuff: 3GPP写成MD有困难喔,因为很多时候不是Spec是选择 02/18 16:00
174F:→ TonyQ: 有机会试试看 opus 4.5 or 4.6 , 不同的东西了. 02/18 16:00
175F:→ TonyQ: sonnet 4.5 确实我也会跟你有一样的想法 我连用都不想用 02/18 16:00
176F:→ nckuff: 好喔 我用用看最新的 看问题有没有改善 02/18 16:02
177F:推 yamakazi: 我说写成md档算照抄过来而已,agent读md档比读pdf快 02/18 16:02
178F:→ TonyQ: 反正一定比 sonnet 4.5 正常 我也是用到 opus 4.5 之後才转 02/18 16:02
179F:→ TonyQ: 往 ai 处理的 sonnet 4.5 就算公司买单我都不太想用 02/18 16:03
180F:→ yamakazi: 叫AI分批看完分批写成md档,他比较好读取,而且md档还可 02/18 16:04
181F:→ yamakazi: 以做成多种agent 02/18 16:04
182F:推 yamakazi: 而且要搭配git多次commit,一边写code一边commit,一边 02/18 16:08
183F:→ yamakazi: 让他写commit msg,这样他的记忆力会慢慢建立起来 02/18 16:08
184F:→ yamakazi: 你要一步做完整个repo是不可能,像我一天可能快十次comm 02/18 16:09
185F:→ yamakazi: it,两三个PR这样,你要自己会叫AI拆成多个小任务,可以 02/18 16:09
186F:→ yamakazi: 叫他先plan first给你看 02/18 16:09
187F:→ yamakazi: 自己不会拆任务就叫AI拆 02/18 16:10
188F:→ yamakazi: 甚至连PR msg都叫他写,人类只负责审核,他自己写git pr 02/18 16:13
189F:→ yamakazi: msg他才会建立起记忆。总之就是先改写pdf变成md,然後 02/18 16:13
190F:→ yamakazi: 叫他放进agent md,再接着一边写code一边commit和开PR, 02/18 16:13
191F:→ yamakazi: PR 和git msg叫他写不要自己写,他写了msg就会有记忆 02/18 16:13
192F:→ nckuff: 我懂你的意思了 02/18 16:13
193F:→ nckuff: 你想表达 所有工作都叫AI完成 AI才会有记忆 之後的工作 02/18 16:14
194F:→ nckuff: 才能做得更精准(也许?) 02/18 16:14
195F:→ nckuff: 但我个人观点是,现在 我自己来写 比教育AI还快 02/18 16:15
196F:→ nckuff: 也许我教育AI 全部都让AI自己做过一次 未来哪一天 02/18 16:15
197F:推 yamakazi: 差不多,人类只负责高阶指导,其他他自己会调用该负责的 02/18 16:15
198F:→ yamakazi: agent,3GPP他绝对记得起来 02/18 16:15
199F:→ nckuff: 它可以做得比我自己来写还快吧 但那一天不知道是多久以後 02/18 16:15
200F:→ yamakazi: 教他很快啦,半小时左右 02/18 16:16
201F:→ yamakazi: 甚至你教他的时候,把它放着让他自己学,你去做其他的事 02/18 16:17
202F:→ yamakazi: ,搞不好他都比你快 02/18 16:17
203F:→ yamakazi: 写个md而已,等他看完写完搞不好你扣才写了几行而已 02/18 16:18
204F:推 nckuff: 我习惯跟AI讨论好怎麽写,最後请AI照我的逻辑一次写完 02/18 16:19
205F:→ yamakazi: 提示词大概是这样,这边有一份3GPP pdf档,把它仔细读完 02/18 16:19
206F:→ yamakazi: 後写成数个适合的agent md,我之後要使用来写程式 02/18 16:19
207F:→ nckuff: 大概没有人是一开始就在写程式的 02/18 16:19
208F:→ yamakazi: 然後你就可以去做其他事了 02/18 16:19
209F:→ nckuff: 结果人还不是要再自己读一遍规格 02/18 16:20
210F:→ nckuff: 才能知道自己下的提示词对不对 AI有没有照自己的想像做完 02/18 16:21
211F:推 yamakazi: 你要double check当然可以,但99.99趴是准的 02/18 16:24
212F:→ yamakazi: 再叫他写一个代理,检查有没有写对,列出几处比较一下就 02/18 16:25
213F:→ yamakazi: 好 02/18 16:25
214F:→ viper9709: 推nckuff分享 02/18 16:26
215F:推 yamakazi: 我写完扣每行都有检查一遍,几乎都是准的,我几乎没改过 02/18 16:26
216F:→ yamakazi: 一行程式或md 02/18 16:26
217F:推 nckuff: 你讲的用AI修正AI 多层AI检查可以防止AI写东西出错 02/18 16:28
218F:→ nckuff: 我认同 但我认为AI无法完全自走的最大原因是 02/18 16:29
219F:→ nckuff: AI会提示词照单全收,你缺资讯 他照样硬生给你 02/18 16:30
220F:→ nckuff: 不太会去质疑提示词 当然人也有这样的问题 02/18 16:30
221F:→ nckuff: 也许新模型有办法反问使用者 做更详细的确认吧 02/18 16:31
222F:推 yamakazi: 会,他不懂的会问,不过如果我也不懂我就叫他自己查完告 02/18 16:34
223F:→ yamakazi: 诉我他觉得哪个比较好 02/18 16:34
224F:→ yamakazi: 选plan mode,遇到重要节点他会跟你确认细节 02/18 16:35
225F:推 nckuff: 我想一想 我承认我就是懒得教育AI 02/18 16:54
226F:→ nckuff: 因为一个通讯系统里面有太多entity,每个entity都牵扯到 02/18 16:54
227F:→ nckuff: 数十个标准文件 我自己就看不完了,更别说花时间教育AI 02/18 16:55
228F:→ nckuff: 真的让AI自己去跑 自己去学,我也没有能力一个一个验证 02/18 16:55
229F:→ nckuff: AI的理解是不是100%正确 02/18 16:55
230F:→ nckuff: 这让我只把AI定义在辅助 不会想放给他太多权限 02/18 16:56
231F:推 yamakazi: 没关系,不想用就不要用 02/18 17:10
232F:→ nckuff: 记得去帮我问3GPP博士对於3GPP+AI的看法 02/18 17:11
233F:→ nckuff: 我真心想知道专业人士的意见 还麻烦你记得分享 02/18 17:12
234F:→ nckuff: 我提出我认为的困难点 你说不想用就不要用 02/18 17:13
235F:→ nckuff: 那我只能寄望你认识的大神能不能给我一点别的建议了 02/18 17:14
236F:→ nckuff: 你提了很多使用上的建议 我认同 即使我懒得花时间 02/18 17:15
237F:→ nckuff: 但是最大的问题就是我说的 写扣99%正确 不代表他对於系统 02/18 17:16
238F:→ nckuff: 认知是99%正确,当他的Context已经超过人类的认知 你 02/18 17:17
239F:→ nckuff: 我都不知道AI给出的回答是不是在唬烂 这就是问题 02/18 17:17
240F:→ nckuff: 当然Context能切,但不知道要切多久 02/18 17:18
241F:→ nckuff: 你很想强调尽量全部丢给AI做 养AI 但养AI的时间成本 02/18 17:19
242F:→ nckuff: 超过AI只是协作辅助的时间成本 只是本末倒置 02/18 17:20
243F:推 yamakazi: 其实我说「不想用就不要用」是很中性的口吻,你不用自动 02/18 17:20
244F:→ yamakazi: 脑补XD 02/18 17:20
245F:推 WTS2accuracy: 4.6一样有这问题 只是症状有改善 context 吃不下就 02/18 17:20
246F:→ WTS2accuracy: 是吃不下 聊久了就忘了前面的 02/18 17:20
247F:→ nckuff: 人力 / AI 各出几分力 才能达到最高效率 不同业界又不一样 02/18 17:20
248F:推 yamakazi: 你都说不想训练了,那我当然也不会勉强你 02/18 17:28
249F:推 yamakazi: 上下文的问题就是要写md ,这你避不掉 02/18 17:34
250F:→ gtr22101361: 现在避免喷token都还是指定4.5 02/18 17:44
251F:推 yamakazi: 而且要拆成小任务,一个任务如果十次对话内还搞不定,代 02/18 17:44
252F:→ yamakazi: 表不够小 02/18 17:44
253F:→ yamakazi: 常用的动作写成固定可用的程式,不要让他每次自己为了某 02/18 17:45
254F:→ yamakazi: 个重复动作重复生成类似程式 02/18 17:45
255F:推 yamakazi: 你写code是不是也会分成数个class?一个类别专注做一件事 02/18 17:53
256F:→ yamakazi: ,物件导向。我跟你说在AI就也是一样 02/18 17:53
258F:推 MrCool5566: 那大神能不能拆几个agent 写出一个自动上ptt 教育那些 02/18 18:10
259F:→ MrCool5566: 不接受ai 的麻瓜 02/18 18:10
260F:推 yamakazi: 这不是网路看看影片就能学会? 02/18 18:20
261F:→ yamakazi: 而且我也不是大神,我碳基小废物 02/18 18:21
262F:推 wade2432: 不是不能讲,是你只会讲一堆没营养的,没啥啓发性,就 02/18 18:27
263F:→ wade2432: 只是一直吹大家都知道的资讯 02/18 18:27
264F:→ wade2432: 这种发文水准感觉就是最快被ai淘汰的 02/18 18:28
265F:→ gtr22101361: 我觉得可以讨论更细节,比如context控管是否停用com 02/18 18:32
266F:→ gtr22101361: pact,子任务之间clear上下文,现在有enable tool s 02/18 18:32
267F:→ gtr22101361: earch是至少mcp肥大问题比较没事,或者serena是否停 02/18 18:32
268F:→ gtr22101361: 用memory 02/18 18:32
269F:推 yamakazi: 我就喜欢讲没营养的废话 02/18 18:39
270F:→ yamakazi: 楼上,你要先让他们能够开始接受ai才能开始一些进阶用法 02/18 18:40
271F:→ yamakazi: 他们还停留在AI错误很多的阶段,搞不好还是用网页对话框 02/18 18:41
272F:→ yamakazi: ,然後认为别人用agent只是下prompt和自动补全的阶段 02/18 18:41
273F:→ MrCool5566: 既然简单还不弄一个agent 7x24 自动战翻麻瓜 02/18 18:51
274F:推 art1: 用到现在,ai 有两个领域感觉很弱,一个是使用 blender,很 02/18 19:03
275F:→ art1: 像完全没有空间概念,讲得头头是道,做起来惨不忍睹 02/18 19:03
276F:→ art1: 当然也可能是我的提示工程太烂了才这样,但跟其他领域比起来 02/18 19:04
277F:→ art1: 真的是比不上 02/18 19:04
278F:→ art1: 另一个则是我也没专业知识的领域,连 ai 是不是在唬烂都无法 02/18 19:05
279F:→ art1: 判断,但产出都跟我预期的差很多,可能在这种领域有更有效的 02/18 19:06
280F:→ art1: 使用 ai 的方式,但我还没学到这种正确的 ai 用法 02/18 19:07
281F:推 art1: 怎麽正确使用 blender 也是我完全没概念的地方,但对於 3D空 02/18 19:09
282F:→ art1: 间的描述,我已经尽力做到力所能及了,但产出依旧烂到一蹋糊 02/18 19:10
283F:→ art1: 涂,不过那些有在使用 3D 建模软体的人可能比较知道跟 AI 下 02/18 19:11
284F:→ art1: 提示词,看他们的产出就好很多,但这样需要专业领域的话,不 02/18 19:12
285F:→ art1: 是很适合 vibe coding 02/18 19:12
286F:推 art1: 希望通用大语言模型能早日有空间概念,让 3D 模型产出更高效 02/18 19:20
287F:→ TonyQ: 不太对 其实AI不会记忆 会有记忆的是留下的 context 02/18 19:52
288F:→ TonyQ: context 这东西 不管你记脑子 写文件 写教学 总之他是可以 02/18 19:52
289F:→ TonyQ: 转移的 02/18 19:52
290F:→ TonyQ: 另外如果连人自己都不知道该怎麽做的 那很有可能是知识的 02/18 19:53
291F:→ TonyQ: 空白区 那种东西就不用太强求AI了 02/18 19:53
292F:→ TonyQ: AI现在效用最高的是 知道该怎麽做的 他帮你把细节做出来 02/18 19:53
293F:→ TonyQ: 有人可能会说我都会作的话, 用他干嘛, 就省力啊 02/18 19:53
294F:→ TonyQ: 我很喜欢举一个例子 你问AI 你的提款卡密码是多少 02/18 19:53
295F:→ TonyQ: 他是无法无中生有生出这个知识的 (除非你写了个txt放电脑 02/18 19:54
296F:→ TonyQ: 然後 vibe coding 从头到尾就是个笑话 XD 不要太认真 02/18 19:54
297F:→ TonyQ: 然後其实 ai 有2d概念 你试着给他 个工具把空间转成 2d图 02/18 19:55
298F:→ TonyQ: 他可以用 2d 视角去[看]或许还有点转机 02/18 19:55
299F:→ ku72: DDIL下的无人机通讯与基於意图的AI认知同步 最近这个真的很 02/18 20:04
300F:→ ku72: 烧我脑 如果AI能直接写出能用的 我非常感谢 02/18 20:04
301F:推 yamakazi: 「直接」很难,就已经讲了你要先让AI去读相关资料,然後 02/18 20:29
302F:→ yamakazi: 拆分任务 02/18 20:29
303F:推 jayxxx: 训练 AI 这点我打一个问号?我自己每一轮对话都当作全新 02/18 20:32
304F:→ jayxxx: 的开始,要请他去读 spec、skills,任何问题都要反问他到 02/18 20:32
305F:→ jayxxx: 细节确定,双方理解一致才开始请他写 plane,确认无误後 02/18 20:32
306F:→ jayxxx: 开始实作 code,验证无误整理成 spec 开始下一个循环 02/18 20:32
307F:推 lchcoding: 听起来,像是先灌 02/18 20:33
308F:→ lchcoding: domain knowledge 进去 02/18 20:33
309F:推 yamakazi: 读资料,写md,建agent,拆分task,多次commit。 02/18 20:35
310F:→ yamakazi: 做完一个task就关掉一个context重建新的,要永久保留的 02/18 20:37
311F:→ yamakazi: 写在代理或技能里 02/18 20:37
312F:推 jayxxx: 也不是全灌进去,这样还没开始写 context 就爆了,专案大 02/18 20:39
313F:→ jayxxx: 方向读完以後,透过关键字 AI 会自己去爬相关的 skills, 02/18 20:39
314F:→ jayxxx: 如果他没有自己识别到,就手动叫他去看 02/18 20:39
315F:推 yamakazi: 楼上正解,终於有好几个懂得人加入讨论了。 02/18 20:45
316F:→ DrTech: yamakazi又选择性瞎眼失忆了,同样的推文:什麽领域护城河 02/18 22:37
317F:→ DrTech: 那麽深,我都在隔壁版举多个例子,他当时也认了,怎麽又突 02/18 22:37
318F:→ DrTech: 然失忆。yamakazi大神写个unity给大家看看?写个Altium de 02/18 22:37
319F:→ DrTech: signer给大家看看?写个 Adobe Photoshop给大家看看? 02/18 22:37
320F:→ DrTech: yamakazi常用烂招:1.断章取义别人文章,加油添醋伪造事实 02/18 22:40
321F:→ DrTech: 。2.选择性瞎眼失忆。3.自己工作领域可以用AI coding。所 02/18 22:40
322F:→ DrTech: 以所有领域都可以,你的领域不能是因为你烂。 02/18 22:40
323F:推 Romulus: Sonnet 4.5的上下文判断能力有点难度就稳死的…… 02/18 22:42
324F:→ Romulus: 要用Sonnet的时候请指定好你认为AI这个task需要的档案 02/18 22:42
325F:→ Romulus: 不然就用Auto 应该不只Kiro有自动判断用哪个model的能力8 02/18 22:43
326F:→ Romulus: 很多部分根本甚至Haiku就做的很好了 我用Kiro的Auto感觉 02/18 22:43
327F:→ Romulus: 是他的判断需要我中断执行然後手动改成Opus的频率不算高 02/18 22:44
328F:推 jack529: 不用这麽FOMO吧,工具一定越来越厉害,现在花这麽多时间 02/18 22:44
329F:→ jack529: 教育AI,明年搞不好都用不到,就稍微了解一下产业状态就 02/18 22:44
330F:→ jack529: 好,时间这麽多不如去写演算法 02/18 22:44
331F:→ jack529: 况且大家都是学电脑科学的,加上写扣也几十年了,还怕自 02/18 22:47
332F:→ jack529: 己不会用新工具辅助写程式吗…这几十年来程式语言、演算 02/18 22:47
333F:→ jack529: 法、系统架构、框架不断出新的,每个难度都比AI工具还难 02/18 22:47
334F:→ jack529: 学的惊,与其一天到晚FOMO不如多花点时间看书配家人…. 02/18 22:47
335F:推 Romulus: 每一个session都是全新的 你都要喂给他够好的context 02/18 22:49
336F:→ Romulus: 然後我有点怀疑nckuff是不是不知道所谓的context其实就是 02/18 22:49
337F:→ Romulus: 每次对话的时候都把前面讲过的东西一而再再而三的重复送 02/18 22:50
338F:→ Romulus: 而怎麽压缩和去芜存菁就是agent的大学问 02/18 22:50
339F:→ Romulus: *指对话历史context 02/18 22:51
340F:→ Romulus: Vibe coding这个词的语意早就发散了 Kiro的Vibe模式就是 02/18 22:52
341F:推 jack529: 其实有一些加入软体工程解决流程的反而更值得研究思考, 02/18 22:52
342F:→ jack529: 而不用拘泥多会教AI洗程式,像这篇stripe工程团队搞一个 02/18 22:52
343F:→ jack529: 内部服务Minions,可以辅助工程师们开发、测试、部署上线 02/18 22:52
344F:→ jack529: ,完美解决工程师容易被bug等等小问题分散注意力的问题, 02/18 22:52
346F:→ jack529: ns-stripes-one-shot-end-to-end-coding-agents 02/18 22:53
347F:→ Romulus: 单纯的下prompt而已 不是那个最原始的啥都不用懂得Vibe 02/18 22:53
348F:→ Romulus: @jayxxx 那也太花时间了 你先大东西给他让他写 然後写错 02/18 22:54
349F:→ Romulus: 的地方给他指正叫他改不是比较快吗 除非你看code很慢 XD 02/18 22:54
350F:→ Romulus: 毕竟单纯写扣正确率一般来说还是很高的 02/18 22:54
351F:→ cybermeow: 老实讲连把ai当作personal assistant 的阶段我觉得都 02/18 22:59
352F:→ cybermeow: 快过时了 02/18 22:59
353F:→ cybermeow: 估计半年後大概又是不同的光景 02/18 23:00
354F:推 Romulus: 呃 Minions就是单纯把流程标准化然後每个步骤串AI而已 02/18 23:02
355F:→ Romulus: 然後标准化谁定的 人定的…… 02/18 23:02
356F:→ cybermeow: 之後每个企业都要有自己的Jarvis 02/18 23:03
357F:→ Romulus: 以及工程师还是要review 只是CI/CD交给AI并直接回馈 02/18 23:03
358F:→ Romulus: 所以解决的事情和你讲的有些差距 02/18 23:04
359F:→ Romulus: 半年我觉得不会有啥大突破 除非哪里天外飞来一笔 02/18 23:05
360F:→ Romulus: 先抓个2~3年吧 02/18 23:05
361F:→ cybermeow: 对於ai进展我是不敢抓一年以上的时间啦 我觉得记忆这 02/18 23:06
362F:→ cybermeow: 块应该是接下来主要看点吧 02/18 23:06
363F:→ cybermeow: 这麽多人在做觉得年底前肯定agent性能会成熟很多 至少 02/18 23:08
364F:→ cybermeow: 龙虾这种prototype产品应该会真的产生影响力 Google之 02/18 23:08
365F:→ cybermeow: 类的也会针对一般人推出更容易上手的方案 02/18 23:08
366F:→ Romulus: agent成熟也还是agent 那不叫不同的光景吧…… 02/18 23:09
367F:→ cybermeow: Claude code release到现在也是刚好一年 02/18 23:09
368F:→ cybermeow: 就agent 用法会变的跟现在差很多吧 02/18 23:09
369F:→ Romulus: 以我来说真的能叫breakthrough的就ChatGPT,再来agent 02/18 23:10
370F:→ cybermeow: Claude code刚出来时也不怎麽好用 但现在已经全部东西 02/18 23:10
371F:→ cybermeow: 可以丢给他做了 02/18 23:10
372F:→ cybermeow: Agent这东西本身一直在进化啊 然後视觉这块目前还是慢 02/18 23:11
373F:→ cybermeow: 很多 如果视觉真的突破了那又是另一件事了 02/18 23:11
374F:推 Romulus: Claude code 2025年才出来 GHC更早就有agent mode了 02/18 23:12
375F:→ cybermeow: 所以我其实基本和jack529的观点类似 02/18 23:12
376F:→ Romulus: 然而可以写code的ChatGPT走到能用的agent就花了3年 02/18 23:13
377F:→ Romulus: 而agent你在ChatGPT练出来的prompt能力基本上都可以照用 02/18 23:14
378F:→ Romulus: 反了吧 我觉得半年看法这很FOMO XD 02/18 23:15
379F:→ cybermeow: 是吗 我觉得因为变的太快了没什麽必要一直去跟 02/18 23:15
380F:→ Romulus: 而且auto complete在很多领域一点都不过时 02/18 23:15
381F:→ cybermeow: 我觉得思考什麽东西是就算一年不去接触最新进展还是有 02/18 23:16
382F:→ cybermeow: 意义的比较有趣 基本上我就是把世界会革命当作前题 02/18 23:16
383F:→ Romulus: 实际上根本没变那麽快 大部分都是patch version等级的 02/18 23:17
384F:→ cybermeow: 当然这是几个月一年还是几年也说不准 02/18 23:17
385F:→ Romulus: 看到感觉minor变了再开始学都不迟 02/18 23:17
386F:推 Romulus: 不然2022到现在7个半年了 你觉得世界怎麽变了七次 02/18 23:22
387F:→ cybermeow: 你可以看看影片模型的进展 一般人的世界可能没有怎麽 02/18 23:24
388F:→ cybermeow: 变 但我们的世界是真的变了 02/18 23:24
389F:→ cybermeow: 我还记得一年前我在测各家影片模型的状况 当时最好的 02/18 23:26
390F:→ cybermeow: 是 kling 1.x 然後半年多一些之前我们推出自己的模型 02/18 23:26
391F:→ cybermeow: 当时基本是图生影片一线模型 然後现在seedance 2.0 02/18 23:26
392F:→ cybermeow: 还有Google藏在手里的genie 当然这些模型实际问题都还 02/18 23:27
393F:→ cybermeow: 很多 我觉得跟llm比都是非常早起不成熟的模型 但这个 02/18 23:27
394F:→ cybermeow: 迭代速度真的是越来越快 02/18 23:27
395F:→ cybermeow: 然後有了新的工具後大家又更有生产力更卷 我觉得这个 02/18 23:29
396F:→ cybermeow: 真的可以说是指数性的 所以我不敢用过去的半年来判断 02/18 23:29
397F:→ cybermeow: 未来的半年 当然也有撞墙的可能性 但现在投资在ai的真 02/18 23:29
398F:→ cybermeow: 的太多了 02/18 23:29
399F:→ cybermeow: 我听到ByteDance 内部的运作方式都觉得不可思议 02/18 23:29
400F:→ cybermeow: 真的是卷到极致 把中国狼性发挥到极致 02/18 23:30
401F:推 Romulus: 如果你的「我们」的意思是developer的话,就和我之前讲的 02/18 23:48
402F:→ Romulus: 一样 ChatGPT agent 只有变二次 02/18 23:48
403F:→ Romulus: Gemini changed nothing major 02/18 23:49
404F:→ Romulus: 那就是improvement而已 02/18 23:49
405F:→ TonyQ: 我是觉得 opus 4.5 是这几年来最大的一个转折,在那之前我 02/19 00:10
406F:→ TonyQ: 也觉得ai 还是没屁用的东西。 02/19 00:10
407F:推 jayxxx: @Romulus 确实走这种 SDD 流程花时间,但相对稳定可控, 02/19 01:05
408F:→ jayxxx: 其他优点不提,最少也可以缓解前面推文大大提到的 AI 自 02/19 01:05
409F:→ jayxxx: 我幻想 02/19 01:05
410F:推 viper9709: 感觉AI进步得好快好恐怖@@ 02/19 01:59
411F:嘘 pttano: 嗯嗯,不错,搞笑仔加上硬凹几乎完美演出 02/19 03:20
412F:→ cybermeow: 我们不是指developper 是指像我在最前线做 02/19 06:36
413F:→ cybermeow: ai development的人 02/19 06:36
414F:→ cybermeow: 不然我说的影片模型进步再快对写程式的人来讲也没什麽 02/19 06:43
415F:→ cybermeow: 影响 gemini对写程式也is never a thing 但他一直都是 02/19 06:43
416F:→ cybermeow: 视觉理解最强的模型 况且香蕉pro出来後对於图片编辑这 02/19 06:43
417F:→ cybermeow: 方面也是颠覆性的 换言之你如果只着眼於ai在单一领域 02/19 06:43
418F:→ cybermeow: 的影响 那他的确革新间隔比较长 但你如果把看的东西放 02/19 06:43
419F:→ cybermeow: 大 从工程 图片 影片 世界模型到研究等等 那我觉得的 02/19 06:43
420F:→ cybermeow: 确每隔一段时间就有个相当可观的进展 02/19 06:43
421F:→ cybermeow: 不过我也同意这些都是improvement 全部东西都是improv 02/19 06:45
422F:→ cybermeow: ement 叠出来的 不过只要一段时间不注意或者因为是非 02/19 06:45
423F:→ cybermeow: 公开的improvement 叠加 看起来就会有怎麽又前进了这 02/19 06:45
424F:→ cybermeow: 麽多的感觉 02/19 06:45
425F:→ Romulus: 那没事了 02/19 09:03
426F:推 Romulus: @jayxxx SDD只是把幻想写进md档而已 当然你要说md档看的 02/19 09:08
427F:→ Romulus: 懂的人比看的懂code的人多那是没错啦…… 02/19 09:08
428F:→ Suleika: SDD是一种方法不是幻想内,现在的问题是不同工具要求的 02/19 09:36
429F:→ Suleika: 规格有差异,以现在的更新速度要做到spec as source等级 02/19 09:36
430F:→ Suleika: 很容易变技术债 02/19 09:36
431F:推 Romulus: 我的意思是SDD留成AI会把幻觉写进md里然後照着幻觉做 02/19 09:53
432F:→ Romulus: 就人类发现幻觉是从md而非从code的差异而已 02/19 09:54
433F:→ Romulus: *流程 02/19 09:54
434F:→ gtr22101361: 那就是story没有review就开始开发 02/19 11:38