[闲聊] AI焊死在晶片上每秒产一万字

时间Sat Feb 21 10:14:30 2026

https://taalas.com/the-path-to-ubiquitous-ai/ 核心技术：Hardcore Models（硬核模型）把整个 AI 模型（权重、参数）直接「硬焊（hard-wire）」到矽晶片上，变成专属 ASIC（应用特定积体电路）从拿到一个新模型开始，只要 2 个月就能做出对应的客制晶片他们称之为「The model is the computer」 —— 模型本身就是电脑，不再需要通用 GPU 去跑软体解决的问题现在 AI 推论（inference）太慢、太贵、太耗电 → 阻碍 AI 真正无所不在（ubiquitous AI） Taalas 想做到像当年 ENIAC → 现代电脑的转变一样，让 AI 变得即时、低成本、低功耗第一代产品：HC1 硬焊的是 Llama 3.1 8B（使用他们自订的 3-bit 基底量化，部分参数 6-bit）效能宣称：单用户：17,000 tokens/sec（约 10 倍於目前 SOTA，如 Groq、Cerebras、 NVIDIA H200 等）建置成本：20 倍便宜功耗：10 倍低缺点：品质比原版 GPU 跑的略有下降（因为激进量化），上下文长度目前有限（但他们说可弹性调整）体验方式：免费聊天 Demo：https://chatjimmy.ai （很多人说打完 Enter 几乎瞬间出答案，感觉像本地跑）也有 Inference API 可申请下一代与路线图 HC2：更高密度、更快，采用标准 4-bit 浮点格式今年春天：中型 reasoning LLM 上 HC1 今年冬天：frontier-level（前沿级）LLM 上 HC2 长期愿景：sub-millisecond 延迟、近乎零成本的即时 AI 跟传统「AI 压缩」的差别传统压缩：量化（8→4→2 bit）、剪枝、蒸馏、MoE 等 → 还是在 GPU/通用硬体上跑 Taalas：直接把压缩後的模型「印到」晶片里 + 储存与运算合一（DRAM 等级密度，没有 HBM、没有先进封装、没有液冷需求），彻底消除记忆体墙简单说：它不是在压缩模型档案大小，而是在压缩「执行 AI 所需的整体成本与延迟」到极致，代价是这个晶片只能跑特定一个模型（极端特化）。目前社群反应（Hacker News 、Reddit、X）很热烈，有人觉得是疯狂的突破，也有人质疑品质下降、模型更新太快是否实用、是否只适合特定低延迟场景。 -- 去它的测试网页用英文叫它写篇小故事啪一下全丢上来耗时0.036秒这种技术以後如果能跟机器人结合应该大有可为吧我想 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.36.247.149 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1771640074.A.0AD.html

1^F：推 Tosca: 出一台便宜的专生色色图就太棒了~~ 02/21 10:37

2^F：→ ninggo: 速度真变态 02/21 10:50

3^F：推 gino0717: 人类的性慾跟不上怎麽办 02/21 12:01

4^F：推 avans: 8B是小资料量，再加上特规3-bit量化，能力十分有限度 02/21 15:27

5^F：→ avans: 不过将软体模型转为硬体晶片，感觉不简单也很有趣 02/21 15:27

6^F：→ error405: 明年能变成搞多大的还不知道 02/21 15:33

7^F：推 v86861062: 酷 02/21 15:37

8^F：推 qiaffvvf: 好猛喔这个 02/21 16:49

9^F：推 stlinman: 生图模型要刻成晶片应该不难? 图像模型小的就很好用了! 02/21 21:46

10^F：推 necrophagist: 好屌 02/21 22:54

11^F：推 Destiny6: 拿来刻TTS应该很适合？ 02/21 23:17

12^F：推 rex7788: 希望能像手机这样可以小型、介面好又耗时低的 02/22 01:08

13^F：→ rex7788: 翻译也能小型化变成即时的就好了 02/22 01:08

14^F：推 WalkingIce: 想到 Java Processor 的概念，把 JVM 做成硬体 02/22 15:25

15^F：推 dragon6: 以後电脑或机器人装置上会不会出现可更换的AI卡 02/24 16:15

16^F：→ error405: https://www.youtube.com/watch?v=4cTSbUGKtRY 03/04 17:19

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

AI_Art 板

[闲聊] AI焊死在晶片上每秒产一万字

热门看板

赞助商连结