作者oppoR20 (发情豹纹)
看板PC_Shopping
标题[闲聊] 前炸G/i皇工程师:只有PROG 5090是安全设
时间Thu Feb 13 22:16:10 2025
https://www.reddit.com/r/pcmasterrace/s/MDplPELwNb
文章很长 我们有请ChatGPT完整翻译
前言与作者背景
首先要说明几点:是的,我供职於业界的竞争对手。但我向你保证,这一点绝不会影响我的
观点。我提到这一点,仅仅是为了有机会教育大家,或许也对用户和潜在买家敲响警钟。
我
曾在 Gigabyte 从事主板设计,不过那已是 17 年前的事了;之後我离开去攻读博士学位,
而过去 13 年我在 Intel 的晶圆厂工作,还短暂待过 ASML。在 Intel 我参与了 14nm、10
nm、4nm 和 2nm 工艺的项目,同时也对 Foveros 和 PowerVia 等技术有所贡献。
此文中的所有内容都是我个人的想法、观点和数据,完全没有任何零部件制造商或公司的介
入。这是一位硬体爱好者与其他爱好者之间的交流。我并不喜欢不得不这麽说,但现在大家
都知道我站在哪一边了。
背景:其他连接器及各针脚额定值
我们大家熟悉并喜爱的 8 针连接器,其着名之处在於它能够承受远高於其标称额定功率的
负荷。
根据规范,每个针脚额定 9A,也就是在 12V 下,每个针脚能传输 108W,这意味着
整个连接器拥有极高的安全裕度,精确来说约为 2.16 倍。而且,如本文後续所讨论,这个
裕度甚至还可以再进一步扩大。
相比之下,6 针连接器的设计更加“过度”,它通常含有 2 或 3 个相同类型的 12V 线路
,也就是说这个额定仅 75W 的小连接器,在其可能的 3 个供电针脚上,每一个都能承担超
过其标称功率的一部分。即使其中有 2/3 的针脚没有使用,剩下的针脚仍有余裕。事实上
,单靠一条额定 9A 的 6 针线路,其安全裕度就比在全负载情况下的 12VHPWR 连接器还要
高,大约有 1.44 倍的余量。
其实我在这里对数值稍作保守处理,因为如今许多知名品牌采用的是 mini-fit HCS(高电
流系统)连接器,其额定可以达到 10A甚至更高。甚至在合适的连接器设计下,一个 8 针
连接器可能可以使单一 12V 针脚承受全额的 12.5A,但我还没找到与这个系列完全匹配、
额定到 13A 的连接器。如果有人知道有这样的产品,我确实有兴趣获得一些来做一个 450W
的 6 针连接器。重点在於,只要显卡的 8 针和 6 针连接器数量正确,基本上除非你故意
操作不当或发生严重故障,否则连接器熔化的可能性是极低的。
连接器问题:额定过高
接下来我们谈谈 12VHPWR 连接器。这些较小的针脚并非来自 Molex 的 mini-fit Jr 系列
,而是更小型的 micro-fit 系列。虽然仍可使用 16AWG 线材,但这些连接器通常只额定每
针 9A或 8.5A,这就引出了问题。
依据 8 针连接器的标准,其要求在 12V 下输出 150W,即 12.5A,平均下来每个针脚大约
需要承载 4.5A。对於额定 9A 的连接器来说,每个针脚实际上只是在其承受能力的一半左
右。
而在一个 600W 的 12VHPWR 连接器中,每个针脚就需要承载约 8.33A。如果使用的是
8.5A 额定的针脚,则几乎毫无裕度;即使是 9A 的针脚,情况也不算理想。这些 8.5A 针
脚在实际情况下,如高环境温度、表面清洁不充分或 GPU 的瞬间功率尖峰等条件下,都容
易失效,9A 的针脚也好不到哪里去。
我坚信问题正出在这里:这些针脚几乎达到了极限,容错裕度只有大约 1/6 A,而这对消费
级硬体来说实在太少。安全因子极低。按照 9A × 12V × 6针计算,总额定功率为 648W;
如果使用 8.5A 针脚,则只有 612W。连接器本身据称能支持最高 660W,所以假设每个针脚
允许有一点超出额定值,或是使用的针脚比我在 Molex 官网上快速查到的稍优,
最终的安
全因子也只有大约 1.1 倍。
请记住,
对於一个损坏的 6 针连接器,即使只有一个 12V 接口在工作,其安全裕度仍可达
1.44 倍。
似乎这个问题业界已经有一定认识和考虑。下图摘自 2021 年 11 月发布的 PCIe 5.0 附加
卡规范第三章 3.3 节,描述了 12VHPWR 连接器感应针的配置:
【图表说明:该图表列出了 12VHPWR 标准下,针对不同两感应针配置的功率限制。
– 当两感应针都处於开路(open-open)状态时,启动功率仅 100W,持续负载时为 150W;
– 当两感应针均接地(ground-ground)时,启动功率可达 375W,持续负载时最高 600W。
】
请注意:启动功率远低於经过软体配置後的持续功率。如果软体配置後功率没有提升,那麽
通过该连接器的最大功率就只有 375W,这仍是 8 针连接器额定功率的两倍多。因此,像 5
090 这样本来需要 4 个 8 针连接器的显卡,可能就可以节省掉 PCB 上一半的空间。375W
在 12V 下意味着约 31.25A,四舍五入大约 32A,这样每个针脚只需承载约 5.33A,这就留
有相当的裕度。虽然这个裕度不如 8 针那般宽裕,但考虑到现行规范要求使用的元件品质
已经比 2000 年代最劣质的 8 针(仅 5A、20AWG 线材)要高,而且市面上也可能存在额定
超过 9A 的 micro-fit 针脚,我认为这样是可以接受的。目前 4080、5080 及以下型号通
常只采用单一连接器,只有部分 OC 版本可能会额外配备第二个 12 针或增加一个 8 针连
接器。
如果以之前 6 针连接器中每个针脚 9A 算,总功率 648W,那麽 375W 的额定就相当於 1.7
2 倍的安全因子。理论上,最少只需 4 个针脚就能承载负荷,剩下仍有约 1.15 倍的裕度
。这大致与最劣质的 8 针连接器(使用弱小的 5A 针脚和 20AWG 线材)的安全极限相当。
即便是我所见过的最劣质的 7A micro-fit 连接器,其安全因子也大约在 1.34 倍左右。
总结来说,连接器本身并没有问题,主要问题在於其额定功率定得过高,导致安全裕度极低
,这意味着在遇到误差或其他不完美情况时,很容易超出安全范围。600W 应该被视为连接
器能承受的绝对最大功率,而实际上 375W 才是一个更合理的额定上限。
Nvidia 的问题(以及合作板卡厂商):拆除了保护措施
作为目前唯一使用该连接器的 GPU 制造商,同时又与 Dell 共同赞助此标准,Nvidia 必须
对此承担部分责任,但他们的显卡合作夥伴也有一定责任。
从 3090 FE 和 3090 Ti FE 的设计来看,可以看出设计师非常注重在连接器各针脚之间平
衡负载,将针脚分成 3 对并使电流均衡分布。这正是我记忆中 Nvidia 传统的板卡设计风
格。他们过去在电源传输设计方面做得非常出色,我推测这也是为了给合作夥伴树立榜样。
基本上,他们在这个设计中将 12 针连接器视作等同於 3 个 8 针连接器,藉由平衡各针脚
的电流来确保每一组都维持在大约 150W 左右的水平。
在 3090 和 3090 Ti FE 上,每一对 12V 针脚都配有独立的分流电阻来监控电流,并且板
上还有一些电源切换硬体,据我推测这些硬体用来在各针脚对之间动态调整各自独立的 VRM
相数。不过,我需要进一步检查 FE 板卡,从更多实物照片中获取细节来确认这一点。
接着谈谈 4090 和 5090 FE 板。这两款板卡将所有 6 个 12V 针脚合并为一个整体,意味
着无法在各针脚或针脚对之间进行电流平衡。对於 4090、5090 以及我推测其他使用这种连
接器的低阶型号来说,这几乎意味着无法分别监控各个针脚的负载,因为它们只监控整个连
接器的总电流。这让我不禁质疑,到底是谁批准了这种设计——我曾经参与过主板设计,实
在无法理解除了节省成本之外,还有什麽理由要去掉这样一个明显关键的安全特性,而这些
成本在大规模生产中只不过是单位数美元甚至几美分。特别是在 4090 显卡故障之後,仍然
在 50 系列中保留这种设计决策,实在让人难以接受,因为那时已经有明确迹象表明需要改
变。那些连接器在达到额定功率 3/4 时就已经出现故障,但他们却选择在没有对电源电路
做出实质改进的情况下,继续提高连接器中传输的功率。
ASUS 以及可能还有其他我尚未提及的厂商,似乎至少试图缓解这种危险。ASUS 的 ROG Ast
ral PCB 在将所有 12V 针脚合并成一个整体之前,增加了一组第二分流电阻,每个针脚都
有独立的监控。据我了解,这套系统可能无法真正实现针脚间的动态负载转移,但至少能够
监测到任何异常,从而警告用户,或者甚至自动采取措施(例如功率限制或关闭系统)以防
止损坏或危险。对於允许超过基本 375W 功率通过连接器的设计来说,这应该是最基本的安
全要求。
再往上一步的保护措施是,在两组 3 针脚之间实现主动电源切换,这一点并不难实现,而
且对我个人来说,也是我在购买显卡时最低会接受的要求。3090 FE 显卡采用的 3 对 2 针
脚配置显示,这样的方案在实际使用中并未引发频繁或灾难性的故障,也正好属於这个范畴
。
如果有 OC 版本的显卡打算在单一连接器上超过 575W 功率,那麽对所有 6 个针脚进行监
控与切换就应该成为必备条件。就我个人而言,我希望所有超过 500W 的显卡都具备这种保
护,因此每一款 5090,甚至许多 4090 都应该如此。尽管对於如此高功率的显卡,我仍然
希望能有多个连接器,但至少若单一连接器能有这级别的保护,我会更有信心使用它。
未来应采取的措施:避免、退货与召回
我的观点是:任何通过 12VHPWR 连接器输出超过基本 375W 功率的显卡都应该被避免购买
。目前所有仅用单线连接的 4090 和 5090 都属於此类,而 5080 的功率(约 360W)则处
於临界状态。
我希望看到那些未采取上述最低保护措施的显卡被认定为危险且可能存在缺陷,进而被召回
。当然,要达到这一点,可能需要对 Nvidia 及其合作的板卡制造商采取大规模的法律行动
。这些厂商似乎认为这没什麽问题,直到消费者把这问题变成自己的问题。
如果你怀疑自己的显卡可能存在风险,那就退货拿回你的钱,然後把钱花在别的地方。毕竟
,2000 多美元还能买到很多东西。如果他们打算卖给你一个潜在危险、缺乏关键安全机制
的产品,那他们就不配得到你的钱。这不仅适用於 Nvidia,AMD 和 Intel 也一样,老实说
,对任何公司都应如此。
—
简单来说着介面就是烂 容错率比以往小很多(1.1倍 vs 以往轻松2倍以上
这个专业人士也点出前几天版友提出的问题 就是电源设计部分
都是参照公版电源喇在一起的设计
除了共硕PROG 加入了电流监控 前一篇5080烧起来就是一个很好的例子
但共硕也就只做到监控後打住 也没进一步得负载转移或是功率限制(共硕目前应该是只有
做到警告而已)
至少式不错的第一步了
所以PROG这下贵的有理了 ㄎㄎ
你各位啊 抢不到5090或许是好事吗 ㄎㄎ
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 42.73.80.236 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/PC_Shopping/M.1739456174.A.B55.html
1F:推 BJshow: 难怪NV设计5080从上市前的400w>360w 看来 42.77.204.19 02/13 22:20
2F:→ BJshow: 早知道了吧 42.77.204.19 02/13 22:20
3F:推 kaj1983: 那5080超频的风险就不是当机了,是烧机.. 36.238.145.185 02/13 22:21
4F:→ kaj1983: 本以为5080超一下就可以看到4090车尾灯 36.238.145.185 02/13 22:21
5F:推 dragonfly667: 真的超到冒烟 118.232.28.42 02/13 22:23
6F:→ friedpig: FE真的不知道哪来自信直接把他并起来 等 114.32.196.169 02/13 22:24
7F:→ friedpig: 於那小片上面要直接跑50A 114.32.196.169 02/13 22:24
8F:推 Depthsharky: 避免..看消费者多饥渴 61.228.71.243 02/13 22:26
9F:→ Depthsharky: 召回 看生产端真的有当回事? 61.228.71.243 02/13 22:27
10F:→ william456: 那4090也只剩名人堂可以买 36.235.137.9 02/13 22:27
11F:→ Depthsharky: 退货(X)囤货(O) 61.228.71.243 02/13 22:27
12F:推 maplefoxs: 根本就是故意的,8pin用好好的硬要改1 150.116.66.153 02/13 22:28
13F:→ maplefoxs: 6pin,结果还不如8pin 150.116.66.153 02/13 22:28
14F:→ william456: 只能期待美国消费者了 36.235.137.9 02/13 22:28
15F:→ maplefoxs: 下一代再换个接头,各位又可以换电源 150.116.66.153 02/13 22:28
16F:→ maplefoxs: 了 150.116.66.153 02/13 22:28
17F:→ william456: 而且夜神也无法做到阻断吧,仅能告知 36.235.137.9 02/13 22:29
18F:→ william456: ,人不在身边就 36.235.137.9 02/13 22:29
19F:→ william456: 且目前曝光的工程板是4x16 36.235.137.9 02/13 22:30
20F:嘘 baddaddy: 没有安全的,那张卡只是跳通知警告你而 36.231.138.149 02/13 22:31
21F:→ baddaddy: 已 36.231.138.149 02/13 22:31
22F:→ twic: 我看要全面停产等5080s了 1.172.237.240 02/13 22:32
23F:推 allyourshit: 就是所有接线状态必须完美 1.34.92.164 02/13 22:32
24F:→ allyourshit: 几乎没什麽容错空间 一点错误就烧熔 1.34.92.164 02/13 22:33
25F:推 a123454698: 电流太高,下一代搞不好走24v 223.23.66.151 02/13 22:33
26F:→ Depthsharky: 跳通知 但模型实验还在跑(X 61.228.71.243 02/13 22:33
27F:推 a77942002: 终於要开始检讨这个烂设计了?223.139.209.217 02/13 22:37
28F:推 kuninaka: 600W的16PIN,太危险了 36.239.110.87 02/13 22:40
29F:→ spfy: 他们不可能不知道吧 27.52.32.2 02/13 22:40
30F:→ NanaMizuki: 整个规格的安全冗余不到10% 125.230.3.2 02/13 22:41
31F:推 sigma9988: 打个游戏还要分心 电流焦虑 36.229.18.241 02/13 22:42
32F:推 Kismeter: 花大钱买显卡还提心吊胆 223.138.217.47 02/13 22:47
33F:→ Kismeter: 5080也别超了,增加风险 223.138.217.47 02/13 22:48
34F:推 twic: 卡厂利润不高又搞这高风险 不乐观啊 1.172.237.240 02/13 22:50
35F:推 E6300: 要阻断就只能上保险丝了吧 1.172.254.51 02/13 22:55
36F:推 savagy: 好的!!4070 8pin再战十年(疑?125.229.193.128 02/13 22:59
37F:推 arnold3: 所以直接用两个或三个8pin还比较好? 182.234.98.55 02/13 23:02
38F:推 dragon6: 我看以後机壳里要装个防火侦烟器了220.134.198.114 02/13 23:05
39F:推 Richun: 3个8pin问题是占空间太多,但12+4的冗余太 1.160.29.12 02/13 23:18
40F:→ Richun: 少,在4090/5090对各环节的要求太高了。 1.160.29.12 02/13 23:18
41F:→ Richun: 单6pin标75W,单8pin标150W,单12+4标600W 1.160.29.12 02/13 23:20
42F:→ spfy: 显卡没在顾功耗吧 CPU有竞争大家还会看一下 27.52.32.2 02/13 23:24
43F:→ spfy: 谁比较省电 显卡老黄想要多少电就要给多少 27.52.32.2 02/13 23:24
44F:推 EnosKP: 要电是一回事 要到烧起来是另一回事 1.169.107.191 02/13 23:31
45F:→ EnosKP: 乖乖用4个8-pin当作SLI 1.169.107.191 02/13 23:32
46F:推 coolmayday: 10%容错??设计这标准接口的人智商堪虑 180.177.1.94 02/13 23:37
47F:推 tagodbless: 8pin占空间? 但是PCB只有散热器的一118.167.232.172 02/13 23:44
48F:→ tagodbless: 半大小,以5090FE,PCB变大,放个4*8p118.167.232.172 02/13 23:44
49F:→ tagodbless: in都轻轻松松118.167.232.172 02/13 23:44
50F:推 guogu: 在硬体上双8pin比12vhpwr可以承受更高电流 36.224.193.238 02/13 23:44
51F:→ guogu: 它们同样都是6组12V但8pin用的接头更粗 36.224.193.238 02/13 23:44
52F:推 a1e: 8pin时代都没听过烧卡,12pin烧卡几乎每年都 36.228.125.250 02/13 23:44
53F:→ a1e: 有好几起,这垃圾12pin什麽时候才换啦 36.228.125.250 02/13 23:45
54F:→ guogu: 结果双8pin额定300W 12vhpwr是600W 36.224.193.238 02/13 23:45
55F:推 jen1121: 怒买5080 114.25.28.170 02/13 23:46
56F:推 jen1121: 3090再战3年 114.25.28.170 02/13 23:47
57F:推 tagodbless: 看5090那可笑的转接线,1转4*8pin,然118.167.232.172 02/13 23:49
58F:→ tagodbless: 後看看4*8pin的总线材粗细,不烧你烧118.167.232.172 02/13 23:49
59F:→ tagodbless: 谁,延长线插电锅微波炉热水瓶,再加118.167.232.172 02/13 23:49
60F:→ tagodbless: 个烤箱,阿弥陀佛118.167.232.172 02/13 23:49
61F:→ commandoEX: 所以原本12PIN是正常的,变成PCIE5的 118.171.139.11 02/13 23:50
62F:→ commandoEX: 12VVHP接头时RATING给太高? 118.171.139.11 02/13 23:51
63F:→ hahn: 之後要换6070开始烧吗..有够烂 114.24.220.98 02/13 23:52
64F:→ idolater: 90卡=集体诉讼的入场券 ? 36.233.189.132 02/13 23:55
65F:推 jen1121: 建议 NVIDIA 显卡只接拉一条插头,绕过ps 114.25.28.170 02/13 23:57
66F:→ jen1121: u 114.25.28.170 02/13 23:57
67F:推 Rust: 现在看来买4070的我实在太睿智了 123.241.91.165 02/14 00:12
68F:推 Khadgar: 简单的说,5090其实根本需要两个12V 2x6 1.173.203.21 02/14 00:32
69F:推 ChakraLinux: 4070唯一的缺点是不能用太大的AI模194.114.136.222 02/14 00:33
70F:→ ChakraLinux: 型194.114.136.222 02/14 00:33
71F:→ cchpt: 我等AMD 1.174.107.196 02/14 00:45
72F:推 pttyu: 下一代看能不能推24V吧 不然再吃更多瓦怎办 114.40.17.201 02/14 00:48
73F:推 cutejojocat: 5080真的会超到冒烟 原来8pin之前没111.241.204.162 02/14 01:03
74F:→ cutejojocat: 什麽问题是留那麽多空间111.241.204.162 02/14 01:03
75F:推 a77942002: n*8pin也不是不会有事 要是搞笑 一样在223.139.209.217 02/14 01:06
76F:→ a77942002: 接头处全部并联 XD223.139.209.217 02/14 01:06
77F:→ BAKAUSAGI: 5080的超频都是在预设的VF曲线下直接 114.24.197.136 02/14 01:08
78F:→ BAKAUSAGI: 超,总功耗和电压都是维持预设的不会 114.24.197.136 02/14 01:08
79F:→ BAKAUSAGI: 变。360w下就很能超了,功耗墙拉高到 114.24.197.136 02/14 01:08
80F:→ BAKAUSAGI: 400w反而没什麽提升空间。 114.24.197.136 02/14 01:08
81F:推 a77942002: 在等一个功率不大记忆体加大的老黄就是223.139.209.217 02/14 01:10
82F:→ a77942002: 不出~223.139.209.217 02/14 01:10
83F:推 ctes940008: 算起来,文章里面传统8pin是9A*12V, 1.175.169.125 02/14 01:30
84F:→ ctes940008: 这样至少能跑600W的欸,但标准设300W 1.175.169.125 02/14 01:30
85F:推 iansuture: 烧,看来得降,除了价钱之外的东西 61.228.230.7 02/14 01:42
86F:推 yiting428: 目前pcie公规就是只有12V跟48V好吗 123.195.76.57 02/14 02:11
87F:推 birdy590: 搞不懂设计的人在搞什麽 前一代就有问题 119.14.42.10 02/14 02:46
88F:→ birdy590: 完全没解决还继续... 供电接头很贵吗? 119.14.42.10 02/14 02:46
89F:→ castorhome: 没margin也不做保护就量产 真的有够 123.192.80.123 02/14 03:35
90F:→ castorhome: 勇敢 123.192.80.123 02/14 03:35
91F:→ cat05joy: 看GN拆ZOTAC也有塞三颗东西方便判断 118.166.207.37 02/14 04:08
92F:→ cat05joy: 但也有说那个只是方便判断没及时效应? 118.166.207.37 02/14 04:08
93F:推 guanting886: 你要设计跟制造两端公司承认这是一 42.78.233.37 02/14 06:51
94F:→ guanting886: 个烂设计是不可能的 42.78.233.37 02/14 06:52
95F:推 tonyian: 看吧节省成本,就说老黄工程师背景的怎124.218.244.180 02/14 06:56
96F:→ tonyian: 可能不知道,人家现在刀工也切向电源了124.218.244.180 02/14 06:56
97F:推 ericinttu: 怎麽会怪华硕 只做到监控後打住 呢? 114.44.136.158 02/14 07:08
98F:→ ericinttu: 这是弄给明眼人巷子内的人看的 114.44.136.158 02/14 07:09
99F:推 boringuy: 省成本啊,不只插头而已,还有PCB面积 101.10.9.19 02/14 08:04
100F:推 v86861062: 真惨 220.134.60.79 02/14 08:04
101F:推 franchy: 他建议12pin跑375W就好 比3个8pin还低XD 223.137.61.201 02/14 08:06
102F:推 b325019: 3mm的针脚还想撑高功耗超级反人类 223.137.60.0 02/14 08:09
103F:推 StNeverRush: 这介面真的很废 NV想把自己玩死就说 101.12.25.171 02/14 08:10
104F:推 cgalen1994: 路边随便找个做水电也会对这种设计保125.229.187.235 02/14 08:29
105F:→ cgalen1994: 持怀疑态度吧,不晓得大厂在想什麽。125.229.187.235 02/14 08:29
106F:推 sma1033: 当然是把耐用度做差一点2年後再赚一笔啊130.216.212.170 02/14 09:06
107F:→ sma1033: 不然大家都不换卡了这生意要怎麽做?130.216.212.170 02/14 09:06
108F:→ sma1033: 接触不良这种事情只要金属接头氧化高机率130.216.212.170 02/14 09:07
109F:→ sma1033: 会发生,而且台湾又超级潮湿130.216.212.170 02/14 09:07
110F:→ sma1033: 让你一张卡用那麽久干嘛,早点坏赚更多130.216.212.170 02/14 09:09
111F:推 kuroshizu21: 耐用度作得差一点让消费者会比较快买 61.227.48.216 02/14 10:51
112F:→ kuroshizu21: 新的产品是一回事, 但若是因为这样的 61.227.48.216 02/14 10:51
113F:→ kuroshizu21: 的考量而把接头做到会烧起来那是不能 61.227.48.216 02/14 10:52
114F:→ kuroshizu21: 容许的, 根本是谋财害命好吗 XDDDDD 61.227.48.216 02/14 10:52
115F:推 sodastream: 看来还是要买有安全装置的卡啊 118.161.82.61 02/14 11:25
116F:→ sodastream: 没想到连几美分的成本也要省 118.161.82.61 02/14 11:25
117F:推 ericinttu: 你要自己举证有谋财害命啊 114.44.136.158 02/14 11:33