作者LDPC (Channel Coding)

看板Stock

标题

Re: [心得] AI需求是供应商精心设计好的套路

时间Sun Mar 22 02:43:38 2026

大大你这样讲不太对啊记忆体和算力是等价互换拿个简单说在训练端你永远可以用gradient accumulation 来降低记忆体训练无法一次跑四个样本那就一个个样本跑记忆体需求降四倍 (算力->记忆体) 这就是你下面举例子在inference端也是有记忆体和算力等价互换 KV Cache -> Token 概念就是事先把已经算过东西存好不用在算一次甚至智能也可以用算力->时间互换(Latency) LLM现在很多不强求一步解会采用类似思考链一步步拆解问题然後验证 ( 对比人类心算一次算跟慢慢手动算) 那你上面两个概念迭在一起少了第三个参数 "速度" 也就是Latency 这也是为何LLM这类模型在Inferece端有一个指标叫做token/sec 简单说就是你硬体用低阶跑但使用算力记忆体互换降低硬体需求你付出的就是速度 token/sec 原本一秒100 token 给你这样一搞一秒5 token 系统慢在消费端就是世界末日不过这边的人喜欢用throughput这个字眼来横量硬体在这方面表现这也是为何有些人觉可以SSD+CPU 来解锁3090这类低VRAM GPU 但却可跑100B模型比方因为你可以用花时间分切100B模型参数迭代是部分放入3090 然後每次计算再放回SSD + CPU 整合 (基本上就是群联aiDAPTIV 套路) 这个就是铁三角(算力记忆体速度) 上面牺牲掉的速度看看精美的aiDAPTIV销售量在消费端速度慢就是垃圾这也是为何苏妈的核心概念就是高速计算你可以看到苏妈的布局就是速度-> 硬体 -> 速度/成本干死你们不论是大AI前时代 (游戏时代) 中期个人电脑或者现在AI时代苏妈核心概念简单 "快" 这造就整家公司企业没有pivot (开会最怕听这个关键字）公司整体策略布局很合理小公司打死大公司最重要就是简单但方向能长久一直执行下去然後现在软体优化基本上可以叫AI去搞当初CUDA这些护城河有可能被x1000打破苏妈一定有想过用AI软体优化他自家RFCOM 增加迭代速度追上CUDA 毕竟现在我司自身看过工程师+AI Agent 单日产出x1000 我就觉我这辈子就这样了(*1) 人类学常常用自家ai优化自己软体左脚踩右脚迭代速度快所以算力小队我就赌这两家高品质硬体+自家生态系在衡量ai算力就是 (记忆体算力 Latency) 等价三角 /单位电力然後人类就是那个分母电池 -- *1 最近在我司又被震撼到一次有一次我把模型训练完强者工程师deploy完但前端要变动很多才能接然後前端就踢皮球说要我们证明模型效能巴巴拉拉啊好处他才要去动通常在以前公司会两个部门主管出来打架盖章然後决定是我们这边迁就他们还是他们照我们路线这种情形在大厂通常是tech lead会花一个礼拜打架决定结果强者工程师x1000 两个小时就把前端写完写个demo 还写了一个工具去把所有过去使用这数据爬虫出来整理套用在我们场景(数据爬虫这个等於是另外一个人工作) 模拟使用者expereicnce 然後证明我们这种模型搭配场景效果直接用证据说话然後前端工程师马上吓得说他会去做因为他意识到他的饭碗跟scope瞬间被强者工程师抢走再多说一句只会让人觉他的能力不行在那刹那我突然意识到以前大厂互相鬼扯打架的谁迁就谁要证明哪个系统好在新创搭配ai agent情况下这些都没意义一切就是比谁能把系统实作出来用结果说话以後就是这样连跨部门吵架都不用tech lead 直接实作系统硬干对方当一个人x1000 就是可以单纯暴力胖揍同事 ※ 引述《teddy98 (泰迪!走吧!)》之铭言： : 我来说说，为甚麽说，AI需求是供应商精心设下的套路吧！ : 刚踏入AI的人 : 可能会觉得，AI的神经网路演算法(大规模平行矩阵运算)， : 好吃硬体资源啊，硬体规格的需求好大，几乎看不到天花板。 : 所以，很多人会有＂AI算力需求是永无止尽的＂这种错觉， : 但用久了开始熟悉AI之後，你会发现， : 其实AI庞大的硬体需求，是一种供应商精心铺设好的套路 : 也是一种吹捧、夸大其辞的行销手段。 : 为甚麽会这样讲？ : 第一，AI模型的节点不一定有经过优化（化繁为简） : 拿软体来比喻，一个source code写很烂的软体，没有经过优化， : 如递回运算，消耗掉比正常高2~3倍以上的硬体资源。 : 会占用大量的 GPU VRAM 和运算周期。 : 这时，你怪的不是AI模型烂，而是AI算力不够？ : 第二，AI模型的运算流程可以分批次进行 : 一个步骤，可以切成4个子步骤进行，用For循环4次执行 : 如生成式绘图，如果一张解析度非常大的图像， : 切割成4个区块，用For循环做4个批次处理，再用TTP图像拼接/重组， : 将4个处理好的图像做合并 : ＂可以大幅减少AI在运算时VRAM的占用量。＂ : 这部分算是AI行家才知道的机密，供应商绝对不会和消费者说。 : 因为要是让你知道了，你就不会为了增大VRAM升级你的显示卡或DRAM了。 : 前阵子，我在看GPU规格时，VRAM总是找不到16G以上的规格， : 现在回想，果真是中了NVIDIA的市场行销套路。 : 因为，辉达，配备VRAM 24G以上的唯独最顶级90系列的GPU才有， : 如: RTX 3090, RTX 4090, RTX 5090 : 现在回想，当时是差点中计了，浪费钱买RTX 5090是不必要的。 : 因为AI算法再怎麽吃资源，也是能透过优化和分批处理，来解决硬体配备不足的部分。 : 实测後，再高解析度的绘图，12G的绘图卡也能胜任。 : 也不需因为GPU记忆体的配置比较低而选用低精度的模型，fp16照样可以跑得很顺畅。 : 目前生成式AI的发展非常快，模型也渐趋成熟了， : 只要巧妙地设置好AI的流程，好像也说不上，需要多高阶的硬体规格来跑AI模型。 : 而且现在的AI模型不断推陈出新，新的AI模型的容量也越来越小。 : 占用的GPU资源也明显下降。 : 大部分旧模型低配要24G VRAM才能跑的，新模型只要16G甚至12G VRAM就能完美运行。 : 不管是文字图片精修，影像P图，视讯P图，设好对的节点，低配的GPU也能完美优化。 : 现在那些号称＂专家＂或＂分析师＂的家伙 : 对於AI的硬体需求越开越高，到达浮滥的地步， : 会有这种现象，很大程度上是供应商（辉达）精心设下的套路。 : 也是为了喊多股市的一种噱头。 : 不过，很少用Photoshop是真的，AI模型很大程度上解决以往在影像修复上的难题。 : 图片经过AI重新生成，容量也变小了 : （原图722KB，修复後268KB，减少将近63%。) 计算: (722-268)/268*100%=62.88% : 试问各位的看法呢？怎麽看未来AI的硬体供货需求？ : 记忆体族群的杂音最多，有人喊AI供货短缺上看2030年 : 但Samsung开始跟客户签长约，有人说可能离市场饱和不远了 : 以目前的记忆体类股的股价来看，是看多还是看空呢？ : ---- : 书脊，修复前 : https://ibb.co/1tzg824g : 书脊，修复後 : https://ibb.co/zWRrPqjr : AI生成 - 虎兔狗 : https://ibb.co/8n8MF5Kr : https://ibb.co/5hwkq4ZB : https://ibb.co/nN83j1XD --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 76.21.72.78 (美国) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1774118620.A.3D2.html ※ 编辑: LDPC (76.21.72.78 美国), 03/22/2026 02:46:18

1^F：推 a0808996 : 好日子要到头了!!! 再继续飞升就要回家吃自己 03/22 02:46

2^F：推 duriamon : 台湾就是代工思维不长进才一狗票人对AI的发展当井底 03/22 02:54

3^F：→ duriamon : 蛙，笑死！ 03/22 02:54

4^F：→ newwu : 原文很明显没有很懂 03/22 02:55

5^F：推 soome : 人类还能再上几年班不被取代QQ 03/22 02:57

6^F：→ duriamon : 当一个东西叠代速度是按月算得，就该知道这东西绝对 03/22 02:57

7^F：→ duriamon : 不是用以前的概念去套，呵呵！ 03/22 02:57

※ 编辑: LDPC (76.21.72.78 美国), 03/22/2026 03:13:15

8^F：推 QQMMWA : 不上班是好事怎麽被某楼说成了坏事一样 03/22 03:45

9^F：→ QQMMWA : 如果人类真的没班可上 03/22 03:45

10^F：→ QQMMWA : 代表人类科技力和上帝一样 03/22 03:45

11^F：→ QQMMWA : 已经有创造智慧体的能力了该开心 03/22 03:45

12^F：→ QQMMWA : 反而是现在的ai 离取代人类还远的很 03/22 03:45

13^F：→ QQMMWA : 人类真的能创造agi 03/22 03:46

14^F：→ QQMMWA : 癌症等各种疾病早就被攻克了 03/22 03:46

15^F：→ QQMMWA : 各种疾病都准备被攻克 03/22 03:46

16^F：→ QQMMWA : ai搞到所有人类都没班可上的程度 03/22 03:46

17^F：→ QQMMWA : 那人类才会幸福 03/22 03:46

18^F：推 ChikanDesu : 原文就自以为发现新大陆实际上前提根本错又觉得大 03/22 04:22

19^F：→ ChikanDesu : 厂是低能花几兆的人决策会比他差？ 03/22 04:22

20^F：推 sdbb : 谢谢 03/22 04:45

21^F：→ layer0930 : 你觉得工作很快的原因是因为 03/22 06:45

22^F：→ layer0930 : 目前ai解决简单的问题很快 03/22 06:45

23^F：→ layer0930 : 实际上复杂的问题还是会拉的很久，且出错问题很大 03/22 06:47

24^F：→ layer0930 : 另外目前ai 不是单纯因为有了 cache 就能解幻觉跟 03/22 06:47

25^F：→ layer0930 : 速度， 03/22 06:47

26^F：→ layer0930 : 爬虫跟一些画面的撰写如果不要求设计风格。靠ai 03/22 06:49

27^F：→ layer0930 : 快速帮忙当然ok 03/22 06:49

28^F：推 jack529 : 新创本就是跟时间对决，还那边提皮球被取代刚好== 03/22 07:34

29^F：推 rereterry : 就…对技术一知半解的人很喜欢跳出来说话，本来就没 03/22 08:20

30^F：→ rereterry : 有什麽都好，原本那篇就有人留言，那种说法根本当7 03/22 08:20

31^F：→ rereterry : 巨头工程师都是白痴 03/22 08:20

32^F：→ layer0930 : 原本那篇不能说他全错，因为模型的迭代跟优化的确 03/22 08:25

33^F：→ layer0930 : 可以省效能。 03/22 08:25

34^F：→ layer0930 : 另外如果把模型专业化而不去用通用模型硬体效能 03/22 08:25

35^F：→ layer0930 : 可以更下去 03/22 08:25

36^F：→ layer0930 : 所以才会出一大堆的模型来解各种问题，而不是通用 03/22 08:26

37^F：→ layer0930 : 模型全解 03/22 08:26

38^F：→ layer0930 : 现在ai好比当年 windows 95,但离到目前os 还差很远 03/22 08:27

39^F：推 kurenaiz : 人类离当电池不远了 03/22 08:28

40^F：→ layer0930 : 但如果用专业的模型可能还是有缺少的功能 03/22 08:29

41^F：→ layer0930 : 所以会在训练 03/22 08:29

42^F：→ layer0930 : 或是可能从通用模型在提炼这样 03/22 08:29

43^F：→ layer0930 : 另外资安跟模型更新都是问题 03/22 08:29

44^F：→ layer0930 : Ssr 的架构混合制，目前仍无法突破物理障碍 03/22 08:29

45^F：→ layer0930 : Ai是一个赔钱货 03/22 08:30

46^F：→ layer0930 : 韩国有游戏公司尝试在做跟我类似的事情，但是他们 03/22 08:31

47^F：→ layer0930 : 也停工了 03/22 08:31

48^F：→ rxsmalllove : 先担心五年後回家会不会吃自己 03/22 08:42

49^F：推 jerrychuang : 哇，那两家？ 03/22 08:43

50^F：推 mdkn35 : 潘董不要再推aiDAPTIV了都没人再训练了 03/22 08:52

51^F：→ SILee : 我觉得你提到了很重要的一件事，再这样发展下去，连 03/22 09:03

52^F：→ SILee : CUDA的生态系都不会再是非要不可的护城河了 03/22 09:03

53^F：→ SILee : 反正叫AI自己重建和验证那些lib，也不用几天。 03/22 09:04

54^F：推 VScode : 太狂惹，好日子要来了 03/22 09:16

55^F：→ layer0930 : Ai 的验证跟人类（需求端）不一定一样 03/22 09:22

56^F：→ layer0930 : 因为语意这件事很模糊 03/22 09:22

57^F：推 poeoe : 现在AI进步就是这麽快码农的冲击会很大 03/22 09:24

58^F：推 poeoe : 只能买好买满AI股才能降低自身风险 03/22 09:26

59^F：推 Nitricacid : 现在真的与其灰半天不如自己来比较快...以前专职嘴 03/22 09:27

60^F：→ Nitricacid : 炮的反而比较危险 03/22 09:27

61^F：推 strlen : 这是真的最近就遇到也是合作对象前端在那边番好啊 03/22 09:36

62^F：→ strlen : 你要番是吧？那我来做大概一个半小时就做完了 03/22 09:36

63^F：→ strlen : 跟前端说你不用忙了我弄好了他整个无言业主感觉也 03/22 09:37

64^F：→ strlen : 懂了什麽啊反正也不是我写都codex和cc在写 03/22 09:37

65^F：→ strlen : 其实工程师真的可以砍掉七八成没问题了 03/22 09:38

66^F：推 devilsabre : 推 03/22 09:42

67^F：推 VScode : 前端真的是最快被取代的，後端至少还有领域知识 03/22 09:47

68^F：→ VScode : 当护城河 03/22 09:47

69^F：→ strlen : 没有什麽护城河了不干活自会有AI收懒人通通下去 03/22 09:57

70^F：→ strlen : 连开AI出来写都懒你还是乖乖当电池 03/22 09:57

71^F：推 create8 : 我准备回乡下种田了 QQ 干 03/22 10:02

72^F：推 aspirev3 : 算力小队 2330+goog吗 03/22 10:30

73^F：推 coke7 : 阿弥陀佛幸好我不是码农 03/22 10:33

74^F：推 hellomo : 推分享 03/22 11:36

75^F：推 cphe : 码农真的是最危险的，尤其纯软 03/22 11:44

76^F：推 Dreamjonbe : 文组看不懂QQ 03/22 11:44

77^F：→ emind : 什麽模型效能要前端改变才能证明？ 03/22 12:19

78^F：推 zaqimon : AI什麽时候能直接帮我的银行帐户x1000 03/22 12:30

79^F：→ zaqimon : 我只需要银行帐户x1000这个简单的功能就好 03/22 12:30

80^F：→ zaqimon : 其他的功能我都不需要 03/22 12:30

81^F：推 darkangel119: 直接说明用实力取代对手的能力 03/22 12:33

82^F：→ bndan : X1000 还要2小时代表原本要2000小时而且是强者同 03/22 12:58

83^F：→ bndan : 事..假设强者工时是一般人2.5倍就好你这个X1000号 03/22 12:59

84^F：→ bndan : 称成立的意思就是原本的需要要一般工程师5000小时才 03/22 12:59

85^F：→ bndan : 能完成以台湾工时计算也就是 625个工作天的需求 == 03/22 13:00

86^F：→ bndan : 这还是计算全工时都在努力完成这需求..= = 03/22 13:01

87^F：→ bndan : X1000这种"号称" 真能成真那AI工时效率公式早换了 03/22 13:01

88^F：→ bndan : 那时应该也不需要强者同事当算式基底了.. 03/22 13:02

89^F：→ bndan : 目前市面上的不敢说AI巅锋应用但常态标准线拉在x4 03/22 13:03

90^F：→ bndan : ~x5 其实就差不多"一般"写程式能加速的范围了扣除 03/22 13:03

91^F：→ bndan : 掉人的问题还要再上去需要配合调整各种对应的流程 03/22 13:04

92^F：→ bndan : 用工业革命来比喻的话就是需要对应各产品准备客制 03/22 13:04

93^F：→ bndan : 化的生产流水线... 03/22 13:05

94^F：→ bndan : 换句话说别说X1000 出个X10的基本上使用范围就会 03/22 13:06

95^F：→ bndan : 被缩小到特定需求或是行业了 03/22 13:06

就人数啊我以前在大厂训练模型tech lead 率领五个人现在我一个人干全部事情训练模型就清洗data ->设计实验-> eval结果->测试新设计现在我开三个agent 帮我干这些事情然後周期又缩短比以前两倍我自己就x10 这个数学式子隐藏意义就是裁员 twitter 7000-> 700是还没有ai agent时代 meta现在是测试一个manager管50个人你去看人类学内部预测一个人可以抵一个团队报告我合作对象deployment AI infra老兄他现在基本除了ML training办不到其他都行了干了前端後端 Datascientist UI PM 基本上一次开5~10个agent 像是langsmith/infra monitor 不过合理说 x1000的确我给他评价本身数字不正确正确数字大概介於x20 ~ x50 不过以前一个人干全司不可能事情正在魔幻的发生因为agent tool不是只有codex/claude 他有前端後端 user testing 一堆现在连user 测试都叫ai测试取代低阶QA 在接下来会有agent call agent 这种更跳跃式的前进更全面自动化反过来简单一件事 amazon现职15万人如果数学式子为真就是x10~x100是合理那意味者就是删减10万员工这也是为何ceo andy说他预测2030 我们只要很少量员工很快会计事务所 20人小公司会缩减到2~3人同理法律事务所现在在美国已经有这趋势电影动画各种产业当x10 x100出现就是人力缩减这就是这公式最大意义 ->裁员你去看现在已经很多财经公司使用claude套件报表人力需求都降低用人力堆上去的软体护城河都不在有任何意义任何产业用人力成本推上去的时间护城河都没意义这不是美国码农懒不懒而是手写code已经渐渐失去意义手写文章手打报告手动处理资讯都失去了价值 ※ 编辑: LDPC (76.21.72.78 美国), 03/22/2026 13:28:59

96^F：→ sdbb : Handjob blowjob 机器人比不上真人 03/22 13:51

97^F：→ sdbb : 手工出嘴巴工作，机器人还是输真人 03/22 13:52

98^F：推 zaqimon : 还是需要创造一堆职缺塞老人吧不然老人要干麽 03/22 14:38

99^F：→ zaqimon : 老人薪资福利要高脑袋僵化体力不行只能当管理职 03/22 14:39

100^F：→ zaqimon : 还好AI无法取代只出一张嘴的肥猫老人 03/22 14:39

101^F：推 ProTrader : 楼楼上你想的太歪了那方面未来机器人应该也能达成 03/22 14:40

102^F：推 zaqimon : 所有的组织内部都一样至少有一半的人是肥猫米虫 03/22 14:41

103^F：→ zaqimon : 然後才来喊基层人力不足 03/22 14:42

104^F：→ zaqimon : 我猜以後警察消防扫地收垃圾开公车通通都是外劳吧 03/22 14:43

105^F：→ zaqimon : 短期内也看不出AI机器人有能力取代这些基层人力 03/22 14:43

106^F：→ zaqimon : 例如到区公所或银行柜台永远塞满人慢吞吞 03/22 14:45

107^F：→ zaqimon : 後面坐着一堆人不知道在干麽 03/22 14:45

108^F：→ zaqimon : 年资越高薪水越高座位就越後面 03/22 14:46

109^F：→ zaqimon : AI永远无法取代那些人 03/22 14:47

110^F：推 shoo42 : 结论要欧印谁QQ ? 记忆蛙还有救吗！救救我 03/22 20:34

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Stock 板

Re: [心得] AI需求是供应商精心设计好的套路

热门看板

赞助商连结