作者ZMTL (Zaious.)

看板PC_Shopping

标题

Fw: [闲聊] RTX3090 单/双卡本地LLM运算AI电脑心得

时间Sun Apr 5 17:57:19 2026

※ [本文转录自 AI_Art 看板 #1fqY_Ppm ] 这篇算是纯粹组装心得文，抛砖引玉给大家参考，目标锁定跑中规模的开源模型，目前来说是Gemma4 26B-A4B,31B 、Qwen3.5 27B,35B-A3B 基本上，我认为GTX3090是唯一信仰，以前没有以後也不会有这价位的24GB+ VRAM显卡了，至於Mac那条路我不熟，有熟的人可以另外补充，但PC架构还是有一定程度的扩充性。先上组好图 https://imgs.plurk.com/QHO/ESJ/LMCfqiXl7TN0oC1300Y2hCUHhFZ_lg.jpg

https://imgs.plurk.com/QHO/KlS/0f4g0RGTY5fJTcbIahpwkdQK9Qj_lg.jpg

以下是我实际用过的单3090配置 CPU (中央处理器)：i5-12400 MB (主机板)：TUF GAMING B660-PLUS WIFI D4 RAM (记忆体)：金士顿 64GB(32GB*2) DDR4-3200 VGA (显示卡)：ZOTAC RTX 3090 TRINITY 24G SSD (固态硬碟)：Kingston金士顿 KC3000 1TB M.2 PSU (电源供应器)：全汉 HYDRO G PRO 1000W/金牌/全模 CHASSIS (机壳)：全汉 CMT370 後来有一度上到128GB记忆体，发现真的没啥用，这张单没什麽特别的，现在照着张组一台二手的应该也没什麽问题，唯一的细节是仅适合单3090，要双3090基本上大半台都要换掉，见以下 ------------ 双3090配置 CPU (中央处理器)：i5-12400 MB (主机板)：MSI Z690 FORCE WIFI RAM (记忆体)：威刚 64GB(32GB*2) DDR5-4800 VGA (显示卡)：ZOTAC RTX 3090 TRINITY 24G MSI RTX 3090 Suprim X SSD (固态硬碟)：Kingston金士顿 KC3000 1TB M.2 PSU (电源供应器)：振华 Leadex 1200W CHASSIS (机壳)：Phanteks Enthoo Pro 2 Server Edition + 9 颗 TL-C12C-S 只留下了CPU、SSD、一张3090，没了，对，就是这麽坑因为双3090跑LLM，LLM要能把模型拆给两张跑需要能让两张PCIE直连8x/8x的主机板，这个条件，基本上DDR4的主机板中没有。就连DDR5，也只有部分的690跟790有，同一系690有不代表790有，不要问我为什麽我不知道，Claude的答案是後续的主机板会把槽留给硬碟？是不是8x/8x 最快的判断方式是看主机板是不是两张显卡槽都有颜色举例来说：这张是(FORCE是CARBON的白色版) https://tw.msi.com/Motherboard/MPG-Z690-CARBON-WIFI 这张不是 https://tw.msi.com/Motherboard/MPG-Z790-CARBON-WIFI 我家AI列出LGA1700符合条件的显卡如下： MSI MPG Z690 CARBON WiFi MSI MEG Z690 / Z790 ACE (MEG 旗舰级才有保留) MSI MEG Z690 UNIFY / UNIFY-X ASUS ProArt Z690 / Z790-CREATOR WiFi ASUS ROG Maximus 系列 (Z690/Z790 Hero, Extreme) Gigabyte Z690 / Z790 AERO D ASRock Z690 / Z790 Taichi AI可能会有幻觉请自行核对、其他脚位可能也要自己研究。不过帮我组上电脑的资工系朋友说我照着AI开菜单组完几乎没买错东西也是很厉害。 (有啦，Claude建议我买一个风扇Hub ，後来发现利民内建串接了算是个小失误) 机壳方面，感谢得到来自这篇文的Zenryaku、ack0011以及其他板友的建议 https://webptt.com/cn.aspx?n=bbs/PC_Shopping/M.1773376727.A.FCF.html 最後是综合Claude意见采用Phanteks Enthoo Pro 2 Server Edition 保证显卡的呼吸空间，优点是整个机壳有15个风扇孔可以装，吹好吹满。 https://www.phanteks.com.tw/Enthoo-Pro2-Server.html https://images.plurk.com/rtYk5LSoncMUC6wnrUTR9.png

虽然我目前还是两张3090叠罗汉，但我觉得应该可以考虑一张拉去旁边站，这个打算下礼拜再来处理，也请大家再建议一下直立方案 (右边硬碟下方应该可以对吧，我没那麽多硬碟) 大家会觉得有点痛的应该还是在涨价後的DRAM上，全新的DDR4 32G一只大概 6-8000、全新的DDR5 32G 都要上万了，最後我买二手的DDR5 32Gx2 花了15000，这部分也仅供参考。至於未来会不会跌？我是说不准，但3090我看涨是肯定的。三年前第一张3090我买19000，上个月第二张3090我买24000，现在价钱大家可以自己看看目前规划上来说，跑本地模型不是为了取代云端模型。是让本地模型完成大量基础、涉及机敏的工作，举例来说： ‧大量 code review 初筛，只把复杂问题送给 Sonnet/Opus ‧机密文件问答，资料不出门 ‧多代理人架构的执行层，成本归零 ‧24 小时批次推理，电费比 API 费用省在本地跑 Qwen / Gemma，云端留给真正需要判断力的任务。我认为 LLM Router 架构才是 2026 年 AI 工作流的核心建设。 Claude 很厉害，但我不会假设它永远都在，掌握自己的动态算力，这才是黄仁勳说的 Sovereign AI。以上是不专业分享，欢迎指导，感谢。 -- AI_Art AI艺术/生成式AI板欢迎各方前来讨论生成式AI相关议题！ ◆ 从 Human-in-the-Loop → Human-AI Symbiosis (人机共生) ◆ LinkedIn：https://www.linkedin.com/in/zaious/ GitHub ：https://github.com/Zaious ChronicleCore (Multi-Agent Ecosystem) 白皮书： https://github.com/Zaious/ChronicleCore-Architecture --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.27.184.211 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1775382489.A.CF0.html ※ 编辑: ZMTL (114.27.184.211 台湾), 04/05/2026 17:57:04

※ 发信站: 批踢踢实业坊(ptt.cc) ※ 转录者: ZMTL (114.27.184.211 台湾), 04/05/2026 17:57:19

1^F：→ ZMTL: 看过板规应该没什麽冒犯的地方吗...? 感谢 114.27.184.211 04/05 17:58

2^F：→ ZMTL: 电虾板尤其是Zenryaku大在我几次组电脑都给 114.27.184.211 04/05 17:58

3^F：→ ZMTL: 了相当详尽的意见，希望把一点AI PC的范本 114.27.184.211 04/05 17:58

4^F：→ ZMTL: 转来板上提供给未来有需要的人参考。 114.27.184.211 04/05 17:58

5^F：推 bobbyac01: 48G跑个30B上下估计只能Q4 也不知道你 1.169.228.66 04/05 18:01

6^F：→ bobbyac01: 有没有建vLLM SGLang 离生产级好远 1.169.228.66 04/05 18:01

7^F：推 Luciferspear: 先推再看 1.171.207.231 04/05 18:01

8^F：推 william456: 3090的背板太烫 114.42.243.63 04/05 18:02

9^F：推 jhjhs33504: 单机生产级多工养龙虾最低IQ2_XXS起跳 36.228.11.93 04/05 18:07

10^F：推 jhjhs33504: 少数模型还有1bit量化技术应该能更省 36.228.11.93 04/05 18:11

11^F：→ ZMTL: 双3090能跑的模型不可能当龙虾主脑啦 114.27.184.211 04/05 18:15

12^F：推 yenchieh1102: 推 101.10.0.87 04/05 18:15

13^F：→ ZMTL: 负责资料收集、文件翻译、知识归纳都很有用 114.27.184.211 04/05 18:15

14^F：→ ZMTL: 上面这些工作让Cluade来跑才真的浪费 114.27.184.211 04/05 18:16

15^F：推 kaj1983: 感谢分享配备，看来cpu不用买太好也能跑 218.166.17.234 04/05 18:21

16^F：推 Rollnmeow: 不知有没有勇者尝试双ARC B70的 49.216.252.165 04/05 18:32

17^F：→ EBVirus: 想请问你的结论这几个模型哪个比较好用 36.239.20.247 04/05 18:34

18^F：→ EBVirus: ？ Gemma 4 31b还是qwen3.5 27b还是35b? 36.239.20.247 04/05 18:34

可以参考AI板文章 https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1772731938.A.221.html https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1775187123.A.6FB.html 快速结论：要推理：云端超级模型 eg.Opus 4.6 > GPT 5.4 > Gemini 3.1 Pro 地端苦工(翻译、资料清洗)：Defense 模型 Gemma4 31B、 Qwen3.5 27B 地端高效(聊天、问题警报)：MoE 模型 Gemma4 26B-A4B、Qwen3.5 35B-A3B 中文需求：Qwen3.5 多模态任务：Gemma4

19^F：推 weiber82: 还是每个月花100美好了… 27.247.32.53 04/05 18:34

20^F：→ ZMTL: Gemma4我还没事，我目前都跑Qwen 114.27.184.211 04/05 18:35

21^F：→ ZMTL: 然後Claude我每个月是订200$，100$都不够用 114.27.184.211 04/05 18:35

22^F：→ ZMTL: 不过Claude这几天才严令用Oauth串订阅养虾 114.27.184.211 04/05 18:36

23^F：→ ZMTL: 你要养虾还是要评估怎麽节流 114.27.184.211 04/05 18:36

24^F：推 saito2190: 两张卡应该是vLLM para开2去跑了吧 1.161.179.230 04/05 18:38

25^F：→ saito2190: 都玩到这样了总不会还在用ollama... 1.161.179.230 04/05 18:38

26^F：→ saito2190: 不知道Qwen3.5 Tool Call的Bug修好了 1.161.179.230 04/05 18:39

27^F：→ saito2190: 没 1.161.179.230 04/05 18:39

诚实来说，我组完双卡就回家过清明了，还在研究怎麽跑双卡比较实际，所以这篇基本上是提供硬体上的心得XD ※ 编辑: ZMTL (114.27.184.211 台湾), 04/05/2026 18:53:06

28^F：推 YCL13: Qwen3.5虽然很强，但使用上真问题一堆 1.161.159.4 04/05 18:51

29^F：推 jhjhs33504: 量化模型要Q8_K或Q8_K_L问题会少很多 36.228.11.93 04/05 19:01

30^F：推 jhjhs33504: 居然还有少数Q8_K_XL量化模型品质更好 36.228.11.93 04/05 19:05

31^F：推 YukihanaLami: 推我就是拉到旁边站两张卡叠加放 118.168.254.20 04/05 19:10

32^F：→ YukihanaLami: 置不适合我这温度敏感党 118.168.254.20 04/05 19:10

33^F：推 YCL13: 如果接受拉到旁边站...其实用拆分卡就好， 1.161.159.4 04/05 19:19

34^F：→ YCL13: 不过原PO本来的卡有点低阶不确定是否支援 1.161.159.4 04/05 19:19

35^F：→ YCL13: 本来的MB 1.161.159.4 04/05 19:20

36^F：→ crimsonmoon9: 3090有没有考虑上nvlink 42.77.204.245 04/05 19:20

37^F：推 ack0011: 其实X570比较容易找到符合的，或是多花 123.241.15.208 04/05 19:53

38^F：→ ack0011: 一点找个TR4 X399就能随便插，还能用相 123.241.15.208 04/05 19:53

39^F：→ ack0011: 对便宜的16G凑到128G 123.241.15.208 04/05 19:53

40^F：→ ZMTL: 对了我要请教一下，直立架+延长线到底能不能 114.27.184.211 04/05 19:58

41^F：→ ZMTL: 保留x8啊，硬体我真的很不懂XDDD 114.27.184.211 04/05 19:58

42^F：→ himekami: X570 proart我记得有x8/x8 111.83.25.151 04/05 20:06

43^F：推 bobbyac01: 直立架跟延长线本身目标就是跑PCIe X1 1.169.228.66 04/05 20:24

44^F：→ bobbyac01: 6 1.169.228.66 04/05 20:24

45^F：→ bobbyac01: 你要跑x8不会有太大问题 1.169.228.66 04/05 20:24

46^F：→ bobbyac01: 但是需要小心讯号不稳 1.169.228.66 04/05 20:24

47^F：→ bobbyac01: 有担心的话可以考虑SFF系列的转接卡 1.169.228.66 04/05 20:24

48^F：推 autopass: 3090 也要缺货了吗? 140.109.40.73 04/05 20:28

49^F：推 fu1vu03: 如果只是翻译功能这几天玩Gemma 4 E4B感 125.229.5.91 04/05 20:30

50^F：→ fu1vu03: 觉比gemma 3 27B还好用 125.229.5.91 04/05 20:30

51^F：推 jhjhs33504: Gemma 4 E4B还支援音讯 Qwen3.5有台语 36.228.11.93 04/05 20:34

52^F：推 d0178411: 前几天才看到有人双3090延长线烧毁楼主 111.71.212.155 04/05 20:36

53^F：→ d0178411: 要用好一点的延长线啊 111.71.212.155 04/05 20:36

54^F：推 hangtenboy: 看不懂还是给推 114.43.130.151 04/05 20:42

55^F：推 Rollnmeow: 原PO指的延长线是PCIE 我还没听过会烧 36.227.219.87 04/05 20:49

56^F：推 william456: https://i.ibb.co/HJ3LTcS/1.jpg 114.42.243.63 04/05 20:56

57^F：→ william456: https://i.ibb.co/r2zg0ZNP/1.jpg 114.42.243.63 04/05 20:56

58^F：推 william456: 有人烧过喔，不少个 114.42.243.63 04/05 20:57

59^F：→ ZMTL: 好用的延长线跟直立架有推荐吗XD 114.27.184.211 04/05 20:59

60^F：推 jack2k: 以现在RAM/SSD金贵的程度，有这样的需求， 114.45.25.190 04/05 21:01

61^F：→ jack2k: DGX Spark好像也不是不能考虑了? 114.45.25.190 04/05 21:01

62^F：→ Rollnmeow: 这有调查过原因吗？我猜也是触点问题 36.227.219.87 04/05 21:01

63^F：推 taobnug: 目前3090用oculink外接（pcie3.0x4）跑c 111.82.146.63 04/05 21:07

64^F：→ taobnug: omfyui和llm使用约一年，一切顺畅。 111.82.146.63 04/05 21:07

65^F：推 william456: 没去追踪，不知道跟GN之前拍过的nz 114.42.243.63 04/05 21:43

66^F：→ william456: xt h1是不是同问题，但品牌都不同 114.42.243.63 04/05 21:43

67^F：推 Rollnmeow: 如果什麽牌子的线都有机会烧起来 36.227.219.87 04/05 21:50

68^F：→ Rollnmeow: 我看解法只剩在机壳里放热像仪了 36.227.219.87 04/05 21:50

69^F：推 lordmi: 我好奇nvlink在消费级系统里面有多大帮助 36.229.66.36 04/05 22:33

70^F：→ lordmi: ，有机会跑一下比较w 36.229.66.36 04/05 22:33

71^F：→ ZMTL: 根据Claude的说法，有没有Nvlink 跑LLM大概 101.8.89.246 04/05 22:39

72^F：→ ZMTL: 差10-15%，主要还是靠PCIE连通，但我不知道 101.8.89.246 04/05 22:39

73^F：→ ZMTL: 真的假的XD 101.8.89.246 04/05 22:39

74^F：推 Supasizeit: TP 跟NVLink好像可以一起上？203.204.195.174 04/05 23:05

75^F：→ Supasizeit: VLLM文件是写可以203.204.195.174 04/05 23:06

76^F：推 ByPass128: 差30到50趴，之前看的实测 27.247.121.167 04/06 00:50

77^F：→ ByPass128: https://bit.ly/4e4jU9C 27.247.121.167 04/06 00:51

78^F：推 hsuallan: 翻译可以试试translate-gemma 61.228.92.55 04/06 01:14

79^F：→ hsuallan: 自己本地跑起还行看VT直播够用了 61.228.92.55 04/06 01:15

80^F：推 qwe753951: 我之前是用Mac studio 放桌上不会吵 114.38.67.135 04/06 03:12

81^F：→ qwe753951: mac那边比较简单，有多少钱买多少ram， 114.38.67.135 04/06 03:17

82^F：→ qwe753951: 一台不够买两台 114.38.67.135 04/06 03:17

83^F：推 michael4210: 3090要搞nvlink的话桥接器非常难买也106.107.176.151 04/06 05:06

84^F：→ michael4210: 不便宜，当初我也是想这样玩但後来发106.107.176.151 04/06 05:06

85^F：→ michael4210: 现成本太高，最後只用一张3090106.107.176.151 04/06 05:06

86^F：推 blueballer: 看来现在就是AI分流的时代了，高难度 223.137.135.24 04/06 07:20

87^F：→ blueballer: 工作给各家最强的AI，简单、机敏的任 223.137.135.24 04/06 07:20

88^F：→ blueballer: 务交给本地模型，不然龙虾token用量 223.137.135.24 04/06 07:21

89^F：→ blueballer: 太大了，不过想问原po任务分配给哪个 223.137.135.24 04/06 07:21

90^F：→ blueballer: 模型龙虾能自己判断吗？还是下指令前 223.137.135.24 04/06 07:21

91^F：→ blueballer: 要注明？ 223.137.135.24 04/06 07:21

92^F：推 uly: 推荐 https://sql-benchmark.nicklothian.com 112.71.133.53 04/06 07:59

93^F：→ uly: 这网站来测试你本地的模型很好玩看能否上23 112.71.133.53 04/06 08:00

94^F：推 uly: 我自己的判断是 token gen>50/s sql分>21 112.71.133.53 04/06 08:10

95^F：→ uly: 才算是日常写程式可用 112.71.133.53 04/06 08:10

96^F：推 uly: 我只有3080TI12GB 用Qwen35 35B也能到70/s 23 112.71.133.53 04/06 08:24

97^F：推 uly: 某些9B蒸馏版本有16分的跑在8G卡简单task能用 112.71.133.53 04/06 08:28

98^F：推 meloxxl: 12G也能跑35b吗我问AI他说会卡成狗建 123.192.184.46 04/06 11:57

99^F：→ meloxxl: 议要有24g以上楼上大大的35b模型有压缩 123.192.184.46 04/06 11:57

100^F：→ meloxxl: 吗 https://i.verb.tw/OltQnlyb.jpg 123.192.184.46 04/06 11:57

101^F：→ crimsonmoon9: Q4大概18GB Q3或Q2可能塞得下吧 42.77.204.245 04/06 12:04

102^F：→ crimsonmoon9: 日常使用可以选低参数量的写程式才 42.77.204.245 04/06 12:07

103^F：→ crimsonmoon9: 比较需要高参数量加上低精度 42.77.204.245 04/06 12:07

104^F：推 uly: Qwen3.5 35B A3B MOE架构12G可跑 27B卡成狗 112.71.133.53 04/06 12:41

105^F：→ uly: 12GB卡都会用Q4左右量化 112.71.133.53 04/06 12:42

106^F：推 necrophagist: Moe架构比dense快很多即使档案较 111.81.34.139 04/06 12:50

107^F：→ necrophagist: 大offload到ram的部分更多也一样 111.81.34.139 04/06 12:50

108^F：→ necrophagist: 但dense模型真的就是比较聪明 111.81.34.139 04/06 12:51

109^F：推 YCL13: 简单来说，多数的AI在回答问题时都没把MOE 59.115.163.173 04/06 13:05

110^F：→ YCL13: 放在答案里，才会说出offload就是慢这种话 59.115.163.173 04/06 13:05

111^F：→ YCL13: ，像记忆体和CPU没影响说法也是这麽来的 59.115.163.173 04/06 13:05

112^F：→ crimsonmoon9: MoE通常都比较快啊只是跟同量级模 42.77.204.245 04/06 13:07

113^F：→ crimsonmoon9: 型比active的参数比较少所以没那麽 42.77.204.245 04/06 13:07

114^F：→ crimsonmoon9: 聪明比较像知识广但是不深 42.77.204.245 04/06 13:07

115^F：→ crimsonmoon9: 如果整个模型可以全塞进VRAM里几乎 42.77.204.245 04/06 13:08

116^F：→ crimsonmoon9: 可以说没有影响是没错 42.77.204.245 04/06 13:08

117^F：推 YCL13: MOE换取速度的代价就是楼上说的聪明，不过 59.115.163.173 04/06 13:10

118^F：→ YCL13: 模型的能力一直在提升，我就觉得gemma4 26B 59.115.163.173 04/06 13:10

119^F：→ YCL13: A4B非常接近Qwen3.5 27B 59.115.163.173 04/06 13:10

120^F：推 Rightclick: 很想把Lab两张3090组起来，但教授说没 39.12.138.153 04/06 13:56

121^F：→ Rightclick: 有双x16损耗太大拒绝了.. 39.12.138.153 04/06 13:56

122^F：→ crimsonmoon9: 找一台epyc就有一堆x16了(x 42.77.204.245 04/06 14:03

123^F：→ linlun0807: 我也在考虑这套组合抑或是要冲6000pr 125.228.86.78 04/06 14:54

124^F：→ linlun0807: o 125.228.86.78 04/06 14:54

125^F：推 pxhome: 3090原生不支援FP8，只能INT8或者FP16， 36.230.188.35 04/06 15:30

126^F：→ pxhome: 24GB只是好看而已 36.230.188.35 04/06 15:30

127^F：推 pxhome: 只有Hopper以後的TensorCore才支持FP8 36.230.188.35 04/06 15:33

128^F：→ pxhome: 首选4090的，或者24GB的MAC M4 36.230.188.35 04/06 15:34

129^F：推 pxhome: Intel ARC B60/B70算力太低不适合跑AI 36.230.188.35 04/06 15:36

130^F：→ pxhome: 30B量化至少要16GB，再往上70B首选是4090 36.230.188.35 04/06 15:37

131^F：→ pxhome: 24GB 36.230.188.35 04/06 15:37

132^F：推 pxhome: 会推MAC是因为GPU&CPU统一记忆体架构，24G 36.230.188.35 04/06 15:40

133^F：→ pxhome: B 250GB/s的频宽相当於GDDR5 256Bit跑30B 36.230.188.35 04/06 15:40

134^F：→ pxhome: 还够用 36.230.188.35 04/06 15:40

135^F：→ pxhome: MAC MINI M4 PRO 36.230.188.35 04/06 15:42

136^F：→ pxhome: gemma-4-31B-it 4Bit量化，VRAM占用量， 36.230.188.35 04/06 15:50

137^F：→ pxhome: 最大19GB 36.230.188.35 04/06 15:50

138^F：→ pxhome: 如果你的口袋够深可以拿64GB 36.230.188.35 04/06 15:52

139^F：推 pxhome: M4 MAX 536GB /s 相当於256Bit GDDR6 ， 6 36.230.188.35 04/06 16:06

140^F：→ pxhome: 4GB跑 70B 4Bit量化很流畅，重点价格还比3 36.230.188.35 04/06 16:06

141^F：→ pxhome: 2GB的5090单卡便宜一些，也不用担心那个 36.230.188.35 04/06 16:06

142^F：→ pxhome: 该死的12pin烧卡 36.230.188.35 04/06 16:06

143^F：→ pxhome: MAC Studio 36.230.188.35 04/06 16:07

144^F：→ pxhome: 如果模型有支援MLX，比如说Gemma 3N， 36.230.188.35 04/06 16:14

145^F：→ pxhome: 可以改用Apple Silicon 16核心NPU来做数 36.230.188.35 04/06 16:14

146^F：→ pxhome: 学推论，作同样的一件事性能提高了3倍，功 36.230.188.35 04/06 16:14

147^F：→ pxhome: 耗只有1/10，这是NV GPU的弱点 36.230.188.35 04/06 16:14

148^F：推 newyorker54: 刚刚测本地gemma 4 , score 21 36.237.178.163 04/06 16:20

149^F：→ newyorker54: http://i.imgur.com/rpGSuyC.jpg 36.237.178.163 04/06 16:20

150^F：推 jhjhs33504: 4Bit量化首选gpt-oss其他品质损耗太大 36.228.11.93 04/06 16:24

151^F：推 jhjhs33504: 模型回覆的品质体感难以单一指标评估 36.228.11.93 04/06 16:27

152^F：→ jhjhs33504: 跑分通常是快慢很多模型问多容易跑题 36.228.11.93 04/06 16:30

153^F：推 scarbywind: 有测试影片说m5比m4快一倍 39.14.32.88 04/06 18:04

154^F：→ necrophagist: 发现前面推文图的ai也太多幻觉了吧 111.81.34.139 04/06 18:13

155^F：→ necrophagist: 笑死xd qwen3.5 7b/14b根本不存在 111.81.34.139 04/06 18:13

156^F：→ necrophagist: 的模型叫它更新确认网路资料再比 111.81.34.139 04/06 18:13

157^F：→ necrophagist: 啦 111.81.34.139 04/06 18:13

158^F：推 jhjhs33504: 可惜速度快的gpt-oss不具图像辨识能力 36.228.11.93 04/06 18:26

159^F：推 newyorker54: 自己用qwen3.5-27b测score 23, 干掉k 36.237.178.163 04/06 18:27

160^F：→ newyorker54: imi k2.5 , 对标qwen3.6 plus 36.237.178.163 04/06 18:27

161^F：→ newyorker54: 干掉glm 5, 这是真的吗？ 36.237.178.163 04/06 18:27

162^F：→ newyorker54: 还比 gpt 5.4高我是不太相信这个数据 36.237.178.163 04/06 18:28

163^F：→ newyorker54: http://i.imgur.com/pXGWNBB.jpg 36.237.178.163 04/06 18:29

164^F：推 uly: 各个benchmark有其观察面向SQL看的是tooling 112.71.133.53 04/06 21:12

165^F：→ uly: 比如说长上下文能力在这个SQL就看不出来 112.71.133.53 04/06 21:13

166^F：推 uly: Qwen3.5 27B可能在这种单SQL场景正确性高 112.71.133.53 04/06 21:17

167^F：推 Esvent: 最近刚好在玩 5090+3090(x4) 效果还不错223.137.179.211 04/07 08:51

168^F：→ Esvent:223.137.179.211 04/07 08:51

169^F：→ Esvent: magnum 72b q4_k_ml 速度超快品质还算可223.137.179.211 04/07 08:51

170^F：→ Esvent: 以223.137.179.211 04/07 08:51

171^F：→ Esvent: magnum 123b iq3_xxs 速度慢一些但更聪223.137.179.211 04/07 08:51

172^F：→ Esvent: 明223.137.179.211 04/07 08:51

173^F：→ Esvent: 不过期间把OS搞坏几次後来发现是ddr5 e223.137.179.211 04/07 08:51

174^F：→ Esvent: xpo 还有主机板ai 超频的问题关掉就稳了223.137.179.211 04/07 08:51

175^F：推 w1222067: x8 x8 主机板不少阿 36.233.68.24 04/07 10:30

176^F：→ ZMTL: 不确定是不是因为我不想换CPU，还是该连CPU 60.250.61.214 04/07 11:19

177^F：→ ZMTL: 都一起换掉 60.250.61.214 04/07 11:19

178^F：→ ZMTL: 1700脚位的真的少 60.250.61.214 04/07 11:19

179^F：推 yymeow: AM5或1851的x8/x8板子选择就不少 60.250.130.216 04/07 11:58

180^F：推 newyorker54: 不具图像辨识能力，可以用mcp调用工120.114.249.100 04/07 15:13

181^F：→ newyorker54: 具，像minimax m2.5可以mcp调用工具120.114.249.100 04/07 15:13

182^F：→ newyorker54: 就可以图像辨识，ocr, 生成影片120.114.249.100 04/07 15:13

183^F：→ newyorker54: 我有实做过，但是mcp 呼叫有被其他模120.114.249.100 04/07 15:16

184^F：→ newyorker54: 型改写过，造成语法不合，现在还在想120.114.249.100 04/07 15:16

185^F：→ newyorker54: 办法复原120.114.249.100 04/07 15:16

186^F：推 basterds: 想组台来看youtube和玩麦块 223.139.193.4 04/07 16:57

187^F：→ RaiGend0519: 看一看电脑里的3080 1.168.0.50 04/07 23:59

188^F：→ RaiGend0519: 还是看大神们怎麽玩吧QwQ 1.168.0.50 04/07 23:59

189^F：推 maurice20097: 48gb可以用Gemma 4 31b fp8的版本 125.227.199.49 04/08 13:17

190^F：→ maurice20097: ，跑起来蛮顺的 125.227.199.49 04/08 13:17

191^F：推 Nitricacid: 现在订阅流量都玩不透明的计算...早 101.10.13.29 04/08 23:42

192^F：→ Nitricacid: 晚都是要自干的不然等着被养套杀 101.10.13.29 04/08 23:42

193^F：→ lordmi: 本地小模型现在就能当玩具没有生产力，等114.136.240.199 04/09 09:46

194^F：→ lordmi: 共通记忆体128白菜价的时候再谈自干吧114.136.240.199 04/09 09:46

195^F：→ lordmi: 补充这句只限个人领域。商用的话不管多少114.136.240.199 04/09 09:48

196^F：→ lordmi: 钱都是洗下去，太多机密资料要本地弄了114.136.240.199 04/09 09:48

197^F：推 AlfaCEcho: 推 42.77.22.192 04/09 21:07

198^F：→ bearq258: gx10 买下去可以用很久，二手也有要 42.78.40.161 05/14 08:13

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

PC_Shopping 板

Fw: [闲聊] RTX3090 单/双卡本地LLM运算AI电脑心得

热门看板

赞助商连结