作者ZMTL (Zaious.)
看板PC_Shopping
标题Fw: [闲聊] RTX3090 单/双卡 本地LLM运算AI电脑心得
时间Sun Apr 5 17:57:19 2026
※ [本文转录自 AI_Art 看板 #1fqY_Ppm ]
这篇算是纯粹组装心得文,抛砖引玉给大家参考,
目标锁定跑中规模的开源模型,目前来说是Gemma4 26B-A4B,31B 、Qwen3.5 27B,35B-A3B
基本上,我认为GTX3090是唯一信仰,以前没有以後也不会有这价位的24GB+ VRAM显卡了,
至於Mac那条路我不熟,有熟的人可以另外补充,但PC架构还是有一定程度的扩充性。
先上组好图
https://imgs.plurk.com/QHO/ESJ/LMCfqiXl7TN0oC1300Y2hCUHhFZ_lg.jpg
https://imgs.plurk.com/QHO/KlS/0f4g0RGTY5fJTcbIahpwkdQK9Qj_lg.jpg
以下是我实际用过的
单3090配置
CPU (中央处理器):i5-12400
MB (主机板):TUF GAMING B660-PLUS WIFI D4
RAM (记忆体):金士顿 64GB(32GB*2) DDR4-3200
VGA (显示卡):ZOTAC RTX 3090 TRINITY 24G
SSD (固态硬碟):Kingston金士顿 KC3000 1TB M.2
PSU (电源供应器):全汉 HYDRO G PRO 1000W/金牌/全模
CHASSIS (机壳):全汉 CMT370
後来有一度上到128GB记忆体,发现真的没啥用,
这张单没什麽特别的,现在照着张组一台二手的应该也没什麽问题,
唯一的细节是仅适合单3090,要双3090基本上大半台都要换掉,见以下
------------
双3090配置
CPU (中央处理器):i5-12400
MB (主机板):MSI Z690 FORCE WIFI
RAM (记忆体):威刚 64GB(32GB*2) DDR5-4800
VGA (显示卡):ZOTAC RTX 3090 TRINITY 24G
MSI RTX 3090 Suprim X
SSD (固态硬碟):Kingston金士顿 KC3000 1TB M.2
PSU (电源供应器):振华 Leadex 1200W
CHASSIS (机壳):Phanteks Enthoo Pro 2 Server Edition + 9 颗 TL-C12C-S
只留下了CPU、SSD、一张3090,没了,对,就是这麽坑
因为双3090跑LLM,LLM要能把模型拆给两张跑需要能让两张PCIE直连8x/8x的主机板,
这个条件,基本上DDR4的主机板中没有。
就连DDR5,也只有部分的690跟790有,同一系690有不代表790有,
不要问我为什麽我不知道,Claude的答案是後续的主机板会把槽留给硬碟?
是不是8x/8x 最快的判断方式是看主机板是不是两张显卡槽
都有颜色
举例来说:
这张是(FORCE是CARBON的白色版)
https://tw.msi.com/Motherboard/MPG-Z690-CARBON-WIFI
这张不是
https://tw.msi.com/Motherboard/MPG-Z790-CARBON-WIFI
我家AI列出LGA1700符合条件的显卡如下:
MSI MPG Z690 CARBON WiFi
MSI MEG Z690 / Z790 ACE (MEG 旗舰级才有保留)
MSI MEG Z690 UNIFY / UNIFY-X
ASUS ProArt Z690 / Z790-CREATOR WiFi
ASUS ROG Maximus 系列 (Z690/Z790 Hero, Extreme)
Gigabyte Z690 / Z790 AERO D
ASRock Z690 / Z790 Taichi
AI可能会有幻觉请自行核对、其他脚位可能也要自己研究。
不过帮我组上电脑的资工系朋友说我照着AI开菜单组完几乎没买错东西也是很厉害。
(有啦,Claude建议我买一个风扇Hub ,後来发现利民内建串接了算是个小失误)
机壳方面,感谢得到来自这篇文的Zenryaku、ack0011以及其他板友的建议
https://webptt.com/cn.aspx?n=bbs/PC_Shopping/M.1773376727.A.FCF.html
最後是综合Claude意见采用Phanteks Enthoo Pro 2 Server Edition
保证显卡的呼吸空间,优点是整个机壳有15个风扇孔可以装,吹好吹满。
https://www.phanteks.com.tw/Enthoo-Pro2-Server.html
https://images.plurk.com/rtYk5LSoncMUC6wnrUTR9.png
虽然我目前还是两张3090叠罗汉,但我觉得应该可以考虑一张拉去旁边站,
这个打算下礼拜再来处理,也请大家再建议一下直立方案
(右边硬碟下方应该可以对吧,我没那麽多硬碟)
大家会觉得有点痛的应该还是在涨价後的DRAM上,
全新的DDR4 32G一只大概 6-8000、全新的DDR5 32G 都要上万了,
最後我买二手的DDR5 32Gx2 花了15000,这部分也仅供参考。
至於未来会不会跌?我是说不准,但3090我看涨是肯定的。
三年前第一张3090我买19000,上个月第二张3090我买24000,现在价钱大家可以自己看看
目前规划上来说,跑本地模型不是为了取代云端模型。
是让本地模型完成大量基础、涉及机敏的工作,举例来说:
‧大量 code review 初筛,只把复杂问题送给 Sonnet/Opus
‧机密文件问答,资料不出门
‧多代理人架构的执行层,成本归零
‧24 小时批次推理,电费比 API 费用省
在本地跑 Qwen / Gemma,云端留给真正需要判断力的任务。
我认为 LLM Router 架构才是 2026 年 AI 工作流的核心建设。
Claude 很厉害,但我不会假设它永远都在,掌握自己的动态算力,
这才是黄仁勳说的 Sovereign AI。
以上是不专业分享,欢迎指导,感谢。
--
AI_Art AI艺术/生成式AI板 欢迎各方前来讨论生成式AI相关议题!
◆ 从 Human-in-the-Loop → Human-AI Symbiosis (人机共生) ◆
LinkedIn:
https://www.linkedin.com/in/zaious/
GitHub :
https://github.com/Zaious
ChronicleCore (Multi-Agent Ecosystem) 白皮书:
https://github.com/Zaious/ChronicleCore-Architecture
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.27.184.211 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1775382489.A.CF0.html
※ 编辑: ZMTL (114.27.184.211 台湾), 04/05/2026 17:57:04
※ 发信站: 批踢踢实业坊(ptt.cc)
※ 转录者: ZMTL (114.27.184.211 台湾), 04/05/2026 17:57:19
1F:→ ZMTL: 看过板规应该没什麽冒犯的地方吗...? 感谢 114.27.184.211 04/05 17:58
2F:→ ZMTL: 电虾板尤其是Zenryaku大在我几次组电脑都给 114.27.184.211 04/05 17:58
3F:→ ZMTL: 了相当详尽的意见,希望把一点AI PC的范本 114.27.184.211 04/05 17:58
4F:→ ZMTL: 转来板上提供给未来有需要的人参考。 114.27.184.211 04/05 17:58
5F:推 bobbyac01: 48G跑个30B上下估计只能Q4 也不知道你 1.169.228.66 04/05 18:01
6F:→ bobbyac01: 有没有建vLLM SGLang 离生产级好远 1.169.228.66 04/05 18:01
7F:推 Luciferspear: 先推再看 1.171.207.231 04/05 18:01
8F:推 william456: 3090的背板太烫 114.42.243.63 04/05 18:02
9F:推 jhjhs33504: 单机生产级多工养龙虾最低IQ2_XXS起跳 36.228.11.93 04/05 18:07
10F:推 jhjhs33504: 少数模型还有1bit量化技术 应该能更省 36.228.11.93 04/05 18:11
11F:→ ZMTL: 双3090能跑的模型不可能当龙虾主脑啦 114.27.184.211 04/05 18:15
12F:推 yenchieh1102: 推 101.10.0.87 04/05 18:15
13F:→ ZMTL: 负责资料收集、文件翻译、知识归纳都很有用 114.27.184.211 04/05 18:15
14F:→ ZMTL: 上面这些工作让Cluade来跑才真的浪费 114.27.184.211 04/05 18:16
15F:推 kaj1983: 感谢分享配备,看来cpu不用买太好也能跑 218.166.17.234 04/05 18:21
16F:推 Rollnmeow: 不知有没有勇者尝试双ARC B70的 49.216.252.165 04/05 18:32
17F:→ EBVirus: 想请问你的结论这几个模型哪个比较好用 36.239.20.247 04/05 18:34
18F:→ EBVirus: ? Gemma 4 31b还是qwen3.5 27b还是35b? 36.239.20.247 04/05 18:34
可以参考AI板文章
https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1772731938.A.221.html
https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1775187123.A.6FB.html
快速结论:
要推理:云端超级模型 eg.Opus 4.6 > GPT 5.4 > Gemini 3.1 Pro
地端苦工(翻译、资料清洗):Defense 模型 Gemma4 31B、 Qwen3.5 27B
地端高效(聊天、问题警报):MoE 模型 Gemma4 26B-A4B、Qwen3.5 35B-A3B
中文需求:Qwen3.5
多模态任务:Gemma4
19F:推 weiber82: 还是每个月花100美好了… 27.247.32.53 04/05 18:34
20F:→ ZMTL: Gemma4我还没事,我目前都跑Qwen 114.27.184.211 04/05 18:35
21F:→ ZMTL: 然後Claude我每个月是订200$,100$都不够用 114.27.184.211 04/05 18:35
22F:→ ZMTL: 不过Claude这几天才严令用Oauth串订阅养虾 114.27.184.211 04/05 18:36
23F:→ ZMTL: 你要养虾还是要评估怎麽节流 114.27.184.211 04/05 18:36
24F:推 saito2190: 两张卡应该是vLLM para开2去跑了吧 1.161.179.230 04/05 18:38
25F:→ saito2190: 都玩到这样了总不会还在用ollama... 1.161.179.230 04/05 18:38
26F:→ saito2190: 不知道Qwen3.5 Tool Call的Bug修好了 1.161.179.230 04/05 18:39
27F:→ saito2190: 没 1.161.179.230 04/05 18:39
诚实来说,我组完双卡就回家过清明了,还在研究怎麽跑双卡比较实际,
所以这篇基本上是提供硬体上的心得XD
※ 编辑: ZMTL (114.27.184.211 台湾), 04/05/2026 18:53:06
28F:推 YCL13: Qwen3.5虽然很强,但使用上真问题一堆 1.161.159.4 04/05 18:51
29F:推 jhjhs33504: 量化模型要Q8_K或Q8_K_L问题会少很多 36.228.11.93 04/05 19:01
30F:推 jhjhs33504: 居然还有少数Q8_K_XL量化模型品质更好 36.228.11.93 04/05 19:05
31F:推 YukihanaLami: 推 我就是拉到旁边站 两张卡叠加放 118.168.254.20 04/05 19:10
32F:→ YukihanaLami: 置不适合我这温度敏感党 118.168.254.20 04/05 19:10
33F:推 YCL13: 如果接受拉到旁边站...其实用拆分卡就好, 1.161.159.4 04/05 19:19
34F:→ YCL13: 不过原PO本来的卡有点低阶不确定是否支援 1.161.159.4 04/05 19:19
35F:→ YCL13: 本来的MB 1.161.159.4 04/05 19:20
36F:→ crimsonmoon9: 3090有没有考虑上nvlink 42.77.204.245 04/05 19:20
37F:推 ack0011: 其实X570比较容易找到符合的,或是多花 123.241.15.208 04/05 19:53
38F:→ ack0011: 一点找个TR4 X399就能随便插,还能用相 123.241.15.208 04/05 19:53
39F:→ ack0011: 对便宜的16G凑到128G 123.241.15.208 04/05 19:53
40F:→ ZMTL: 对了我要请教一下,直立架+延长线到底能不能 114.27.184.211 04/05 19:58
41F:→ ZMTL: 保留x8啊,硬体我真的很不懂XDDD 114.27.184.211 04/05 19:58
42F:→ himekami: X570 proart我记得有x8/x8 111.83.25.151 04/05 20:06
43F:推 bobbyac01: 直立架跟延长线本身目标就是跑PCIe X1 1.169.228.66 04/05 20:24
44F:→ bobbyac01: 6 1.169.228.66 04/05 20:24
45F:→ bobbyac01: 你要跑x8不会有太大问题 1.169.228.66 04/05 20:24
46F:→ bobbyac01: 但是需要小心讯号不稳 1.169.228.66 04/05 20:24
47F:→ bobbyac01: 有担心的话可以考虑SFF系列的转接卡 1.169.228.66 04/05 20:24
48F:推 autopass: 3090 也要缺货了吗? 140.109.40.73 04/05 20:28
49F:推 fu1vu03: 如果只是翻译功能这几天玩Gemma 4 E4B感 125.229.5.91 04/05 20:30
50F:→ fu1vu03: 觉比gemma 3 27B还好用 125.229.5.91 04/05 20:30
51F:推 jhjhs33504: Gemma 4 E4B还支援音讯 Qwen3.5有台语 36.228.11.93 04/05 20:34
52F:推 d0178411: 前几天才看到有人双3090延长线烧毁 楼主 111.71.212.155 04/05 20:36
53F:→ d0178411: 要用好一点的延长线啊 111.71.212.155 04/05 20:36
54F:推 hangtenboy: 看不懂还是给推 114.43.130.151 04/05 20:42
55F:推 Rollnmeow: 原PO指的延长线是PCIE 我还没听过会烧 36.227.219.87 04/05 20:49
58F:推 william456: 有人烧过喔,不少个 114.42.243.63 04/05 20:57
59F:→ ZMTL: 好用的延长线跟直立架有推荐吗XD 114.27.184.211 04/05 20:59
60F:推 jack2k: 以现在RAM/SSD金贵的程度,有这样的需求, 114.45.25.190 04/05 21:01
61F:→ jack2k: DGX Spark好像也不是不能考虑了? 114.45.25.190 04/05 21:01
62F:→ Rollnmeow: 这有调查过原因吗?我猜也是触点问题 36.227.219.87 04/05 21:01
63F:推 taobnug: 目前3090用oculink外接(pcie3.0x4)跑c 111.82.146.63 04/05 21:07
64F:→ taobnug: omfyui和llm使用约一年,一切顺畅。 111.82.146.63 04/05 21:07
65F:推 william456: 没去追踪,不知道跟GN之前拍过的nz 114.42.243.63 04/05 21:43
66F:→ william456: xt h1是不是同问题,但品牌都不同 114.42.243.63 04/05 21:43
67F:推 Rollnmeow: 如果什麽牌子的线都有机会烧起来 36.227.219.87 04/05 21:50
68F:→ Rollnmeow: 我看解法只剩在机壳里放热像仪了 36.227.219.87 04/05 21:50
69F:推 lordmi: 我好奇nvlink在消费级系统里面有多大帮助 36.229.66.36 04/05 22:33
70F:→ lordmi: ,有机会跑一下比较w 36.229.66.36 04/05 22:33
71F:→ ZMTL: 根据Claude的说法,有没有Nvlink 跑LLM大概 101.8.89.246 04/05 22:39
72F:→ ZMTL: 差10-15%,主要还是靠PCIE连通,但我不知道 101.8.89.246 04/05 22:39
73F:→ ZMTL: 真的假的XD 101.8.89.246 04/05 22:39
74F:推 Supasizeit: TP 跟NVLink好像可以一起上?203.204.195.174 04/05 23:05
75F:→ Supasizeit: VLLM文件是写可以203.204.195.174 04/05 23:06
76F:推 ByPass128: 差30到50趴,之前看的实测 27.247.121.167 04/06 00:50
78F:推 hsuallan: 翻译可以试试translate-gemma 61.228.92.55 04/06 01:14
79F:→ hsuallan: 自己本地跑起还行 看VT直播够用了 61.228.92.55 04/06 01:15
80F:推 qwe753951: 我之前是用Mac studio 放桌上不会吵 114.38.67.135 04/06 03:12
81F:→ qwe753951: mac那边比较简单,有多少钱买多少ram, 114.38.67.135 04/06 03:17
82F:→ qwe753951: 一台不够买两台 114.38.67.135 04/06 03:17
83F:推 michael4210: 3090要搞nvlink的话桥接器非常难买也106.107.176.151 04/06 05:06
84F:→ michael4210: 不便宜,当初我也是想这样玩但後来发106.107.176.151 04/06 05:06
85F:→ michael4210: 现成本太高,最後只用一张3090106.107.176.151 04/06 05:06
86F:推 blueballer: 看来现在就是AI分流的时代了,高难度 223.137.135.24 04/06 07:20
87F:→ blueballer: 工作给各家最强的AI,简单、机敏的任 223.137.135.24 04/06 07:20
88F:→ blueballer: 务交给本地模型,不然龙虾token用量 223.137.135.24 04/06 07:21
89F:→ blueballer: 太大了,不过想问原po任务分配给哪个 223.137.135.24 04/06 07:21
90F:→ blueballer: 模型龙虾能自己判断吗?还是下指令前 223.137.135.24 04/06 07:21
91F:→ blueballer: 要注明? 223.137.135.24 04/06 07:21
93F:→ uly: 这网站来测试你本地的模型 很好玩 看能否上23 112.71.133.53 04/06 08:00
94F:推 uly: 我自己的判断是 token gen>50/s sql分>21 112.71.133.53 04/06 08:10
95F:→ uly: 才算是日常写程式可用 112.71.133.53 04/06 08:10
96F:推 uly: 我只有3080TI12GB 用Qwen35 35B也能到70/s 23 112.71.133.53 04/06 08:24
97F:推 uly: 某些9B蒸馏版本有16分的跑在8G卡简单task能用 112.71.133.53 04/06 08:28
98F:推 meloxxl: 12G也能跑35b吗 我问AI他说会卡成狗 建 123.192.184.46 04/06 11:57
99F:→ meloxxl: 议要有24g以上楼上大大的35b模型有压缩 123.192.184.46 04/06 11:57
101F:→ crimsonmoon9: Q4大概18GB Q3或Q2可能塞得下吧 42.77.204.245 04/06 12:04
102F:→ crimsonmoon9: 日常使用可以选低参数量的 写程式才 42.77.204.245 04/06 12:07
103F:→ crimsonmoon9: 比较需要高参数量加上低精度 42.77.204.245 04/06 12:07
104F:推 uly: Qwen3.5 35B A3B MOE架构12G可跑 27B卡成狗 112.71.133.53 04/06 12:41
105F:→ uly: 12GB卡都会用Q4左右量化 112.71.133.53 04/06 12:42
106F:推 necrophagist: Moe架构比dense快很多 即使档案较 111.81.34.139 04/06 12:50
107F:→ necrophagist: 大offload到ram的部分更多也一样 111.81.34.139 04/06 12:50
108F:→ necrophagist: 但dense模型真的就是比较聪明 111.81.34.139 04/06 12:51
109F:推 YCL13: 简单来说,多数的AI在回答问题时都没把MOE 59.115.163.173 04/06 13:05
110F:→ YCL13: 放在答案里,才会说出offload就是慢这种话 59.115.163.173 04/06 13:05
111F:→ YCL13: ,像记忆体和CPU没影响说法也是这麽来的 59.115.163.173 04/06 13:05
112F:→ crimsonmoon9: MoE通常都比较快啊 只是跟同量级模 42.77.204.245 04/06 13:07
113F:→ crimsonmoon9: 型比active的参数比较少所以没那麽 42.77.204.245 04/06 13:07
114F:→ crimsonmoon9: 聪明 比较像知识广但是不深 42.77.204.245 04/06 13:07
115F:→ crimsonmoon9: 如果整个模型可以全塞进VRAM里几乎 42.77.204.245 04/06 13:08
116F:→ crimsonmoon9: 可以说没有影响是没错 42.77.204.245 04/06 13:08
117F:推 YCL13: MOE换取速度的代价就是楼上说的聪明,不过 59.115.163.173 04/06 13:10
118F:→ YCL13: 模型的能力一直在提升,我就觉得gemma4 26B 59.115.163.173 04/06 13:10
119F:→ YCL13: A4B非常接近Qwen3.5 27B 59.115.163.173 04/06 13:10
120F:推 Rightclick: 很想把Lab两张3090组起来,但教授说没 39.12.138.153 04/06 13:56
121F:→ Rightclick: 有双x16损耗太大拒绝了.. 39.12.138.153 04/06 13:56
122F:→ crimsonmoon9: 找一台epyc就有一堆x16了(x 42.77.204.245 04/06 14:03
123F:→ linlun0807: 我也在考虑这套组合 抑或是要冲6000pr 125.228.86.78 04/06 14:54
124F:→ linlun0807: o 125.228.86.78 04/06 14:54
125F:推 pxhome: 3090原生不支援FP8, 只能INT8或者FP16, 36.230.188.35 04/06 15:30
126F:→ pxhome: 24GB只是好看而已 36.230.188.35 04/06 15:30
127F:推 pxhome: 只有Hopper以後的TensorCore才支持FP8 36.230.188.35 04/06 15:33
128F:→ pxhome: 首选4090的,或者24GB的MAC M4 36.230.188.35 04/06 15:34
129F:推 pxhome: Intel ARC B60/B70算力太低不适合跑AI 36.230.188.35 04/06 15:36
130F:→ pxhome: 30B量化至少要16GB,再往上70B首选是4090 36.230.188.35 04/06 15:37
131F:→ pxhome: 24GB 36.230.188.35 04/06 15:37
132F:推 pxhome: 会推MAC是因为GPU&CPU统一记忆体架构,24G 36.230.188.35 04/06 15:40
133F:→ pxhome: B 250GB/s的频宽相当於GDDR5 256Bit跑30B 36.230.188.35 04/06 15:40
134F:→ pxhome: 还够用 36.230.188.35 04/06 15:40
135F:→ pxhome: MAC MINI M4 PRO 36.230.188.35 04/06 15:42
136F:→ pxhome: gemma-4-31B-it 4Bit量化,VRAM占用量, 36.230.188.35 04/06 15:50
137F:→ pxhome: 最大19GB 36.230.188.35 04/06 15:50
138F:→ pxhome: 如果你的口袋够深可以拿64GB 36.230.188.35 04/06 15:52
139F:推 pxhome: M4 MAX 536GB /s 相当於256Bit GDDR6 , 6 36.230.188.35 04/06 16:06
140F:→ pxhome: 4GB跑 70B 4Bit量化很流畅,重点价格还比3 36.230.188.35 04/06 16:06
141F:→ pxhome: 2GB的5090单卡便宜一些,也不用担心那个 36.230.188.35 04/06 16:06
142F:→ pxhome: 该死的12pin烧卡 36.230.188.35 04/06 16:06
143F:→ pxhome: MAC Studio 36.230.188.35 04/06 16:07
144F:→ pxhome: 如果模型有支援MLX, 比如说Gemma 3N, 36.230.188.35 04/06 16:14
145F:→ pxhome: 可以改用Apple Silicon 16核心NPU来做数 36.230.188.35 04/06 16:14
146F:→ pxhome: 学推论,作同样的一件事性能提高了3倍,功 36.230.188.35 04/06 16:14
147F:→ pxhome: 耗只有1/10,这是NV GPU的弱点 36.230.188.35 04/06 16:14
148F:推 newyorker54: 刚刚测本地gemma 4 , score 21 36.237.178.163 04/06 16:20
150F:推 jhjhs33504: 4Bit量化首选gpt-oss其他品质损耗太大 36.228.11.93 04/06 16:24
151F:推 jhjhs33504: 模型回覆的品质体感难以单一指标评估 36.228.11.93 04/06 16:27
152F:→ jhjhs33504: 跑分通常是快慢 很多模型问多容易跑题 36.228.11.93 04/06 16:30
153F:推 scarbywind: 有测试影片说m5比m4快一倍 39.14.32.88 04/06 18:04
154F:→ necrophagist: 发现前面推文图的ai也太多幻觉了吧 111.81.34.139 04/06 18:13
155F:→ necrophagist: 笑死xd qwen3.5 7b/14b根本不存在 111.81.34.139 04/06 18:13
156F:→ necrophagist: 的模型 叫它更新确认网路资料再比 111.81.34.139 04/06 18:13
157F:→ necrophagist: 啦 111.81.34.139 04/06 18:13
158F:推 jhjhs33504: 可惜速度快的gpt-oss不具图像辨识能力 36.228.11.93 04/06 18:26
159F:推 newyorker54: 自己用qwen3.5-27b测score 23, 干掉k 36.237.178.163 04/06 18:27
160F:→ newyorker54: imi k2.5 , 对标qwen3.6 plus 36.237.178.163 04/06 18:27
161F:→ newyorker54: 干掉glm 5, 这是真的吗? 36.237.178.163 04/06 18:27
162F:→ newyorker54: 还比 gpt 5.4高我是不太相信这个数据 36.237.178.163 04/06 18:28
164F:推 uly: 各个benchmark有其观察面向SQL看的是tooling 112.71.133.53 04/06 21:12
165F:→ uly: 比如说长上下文能力在这个SQL就看不出来 112.71.133.53 04/06 21:13
166F:推 uly: Qwen3.5 27B可能在这种单SQL场景正确性高 112.71.133.53 04/06 21:17
167F:推 Esvent: 最近刚好在玩 5090+3090(x4) 效果还不错223.137.179.211 04/07 08:51
168F:→ Esvent:223.137.179.211 04/07 08:51
169F:→ Esvent: magnum 72b q4_k_ml 速度超快 品质还算可223.137.179.211 04/07 08:51
170F:→ Esvent: 以223.137.179.211 04/07 08:51
171F:→ Esvent: magnum 123b iq3_xxs 速度慢一些 但更聪223.137.179.211 04/07 08:51
172F:→ Esvent: 明223.137.179.211 04/07 08:51
173F:→ Esvent: 不过期间把OS搞坏几次 後来发现是ddr5 e223.137.179.211 04/07 08:51
174F:→ Esvent: xpo 还有主机板ai 超频的问题 关掉就稳了223.137.179.211 04/07 08:51
175F:推 w1222067: x8 x8 主机板 不少阿 36.233.68.24 04/07 10:30
176F:→ ZMTL: 不确定是不是因为我不想换CPU,还是该连CPU 60.250.61.214 04/07 11:19
177F:→ ZMTL: 都一起换掉 60.250.61.214 04/07 11:19
178F:→ ZMTL: 1700脚位的真的少 60.250.61.214 04/07 11:19
179F:推 yymeow: AM5或1851的x8/x8板子选择就不少 60.250.130.216 04/07 11:58
180F:推 newyorker54: 不具图像辨识能力,可以用mcp调用工120.114.249.100 04/07 15:13
181F:→ newyorker54: 具,像minimax m2.5可以mcp调用工具120.114.249.100 04/07 15:13
182F:→ newyorker54: 就可以图像辨识,ocr, 生成影片120.114.249.100 04/07 15:13
183F:→ newyorker54: 我有实做过,但是mcp 呼叫有被其他模120.114.249.100 04/07 15:16
184F:→ newyorker54: 型改写过,造成语法不合,现在还在想120.114.249.100 04/07 15:16
185F:→ newyorker54: 办法复原120.114.249.100 04/07 15:16
186F:推 basterds: 想组台来看youtube和玩麦块 223.139.193.4 04/07 16:57
187F:→ RaiGend0519: 看一看电脑里的3080 1.168.0.50 04/07 23:59
188F:→ RaiGend0519: 还是看大神们怎麽玩吧QwQ 1.168.0.50 04/07 23:59
189F:推 maurice20097: 48gb可以用Gemma 4 31b fp8的版本 125.227.199.49 04/08 13:17
190F:→ maurice20097: ,跑起来蛮顺的 125.227.199.49 04/08 13:17
191F:推 Nitricacid: 现在订阅流量都玩不透明的计算...早 101.10.13.29 04/08 23:42
192F:→ Nitricacid: 晚都是要自干的不然等着被养套杀 101.10.13.29 04/08 23:42
193F:→ lordmi: 本地小模型现在就能当玩具没有生产力,等114.136.240.199 04/09 09:46
194F:→ lordmi: 共通记忆体128白菜价的时候再谈自干吧114.136.240.199 04/09 09:46
195F:→ lordmi: 补充这句只限个人领域。商用的话不管多少114.136.240.199 04/09 09:48
196F:→ lordmi: 钱都是洗下去,太多机密资料要本地弄了114.136.240.199 04/09 09:48
197F:推 AlfaCEcho: 推 42.77.22.192 04/09 21:07
198F:→ bearq258: gx10 买下去 可以用很久,二手也有要 42.78.40.161 05/14 08:13