作者pl132 (pl132)
看板Tech_Job
标题[新闻]新模型 R2 延後主因!DeepSeek 尝试华为
时间Thu Aug 14 19:58:01 2025
新模型 R2 延後主因!DeepSeek 尝试华为晶片失败,还是得靠 NVIDIA
https://tinyurl.com/24gqjw6w
中国人工智慧(AI)公司 DeepSeek 在尝试使用华为晶片训练新模型失败後,延後新一代
模型的发布,这也凸显北京推动取代美国技术的困难。
知情人士透露,DeepSeek 在 1 月发布 R1 模型後,受到官方鼓励,改采用华为昇腾(
Ascend)处理器,而非 NVIDIA 系统。
然而,在使用昇腾晶片进行 R2 训练过程中持续遇到技术问题,因此改回 NVIDIA 晶片进
行训练,仅在推理(Inference)阶段使用华为晶片。知情人士透露,这是模型发布从 5
月延後的主要原因,导致 DeepSeek 在竞争中落後。
所谓「训练」是模型透过大量资料集中学习,「推理」则利用已训练好的模型进行预测或
产生回应。由此可知,中国晶片在关键任务上仍落後美国竞争对手,这也是中国追求半导
体自给自足所面临的挑战。
外媒《金融时报》(FT)指出,北京已要求中国科技公司必须为订购 NVIDIA H20 晶片提
供正当理由,藉此推广华为、寒武纪(Cambricon)等国产替代方案。
业界人士认为,与 NVIDIA 产品相比,中国晶片存在稳定性问题、晶片间连线速度较慢,
以及软体水准较差等劣势。
据悉,华为曾派出一支工程师团队前往 DeepSeek 办公室,协助利用其 AI 晶片开发 R2
模型。但即使如此,DeepSeek 仍无法在昇腾晶片上成功完成一次训练。不过,DeepSeek
与华为合作改为将模型在推理(Inference)阶段能相容於昇腾晶片。
知情人士透露,DeepSeek 创办人梁文峰在内部表达对 R2 进展不满,并努力投入更多时
间打造更先进模型,以维持公司在 AI 领域的领先地位。R2 发布延後的原因还包括更新
模型所需的资料标注时间比预期更长,根据中媒报导,该模型有望在未来数周内发布。
加州大学柏克莱分校 AI 研究员 Ritwik Gupta 认为,将昇腾用於训练这方面,华为正在
经历「成长痛」,但预期它最终会适应,「我们今天还没看到用华为训练的领先模型,不
代表未来不会发生。这只是时间问题」。
==========
其实是华为没有台积电,没办法搞出好晶片,难怪老黄有恃无恐
就算缴15%获利也没差,应该可以拖住中国AI发展到2030年
--
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 180.177.204.57 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Tech_Job/M.1755172683.A.2A0.html
1F:推 supereva: amd可以用台积都差nv那麽远了 36.231.48.118 08/14 20:04
2F:推 gold9450412: 中国短时间能追成这样 也是很夸张了 101.8.163.208 08/14 20:33
3F:→ gold9450412: NV本来就有几十年的GPU生态系 101.8.163.208 08/14 20:34
4F:推 boards: 中国依赖台湾高阶晶片 101.12.162.210 08/14 20:48
5F:推 TameFoxx: 能接近NV的可能只有AVGO了 219.68.125.23 08/15 00:03
6F:推 SkyFluid: 说几十年会不会太夸张… cuda是哪一年 111.240.103.63 08/15 07:41
7F:→ SkyFluid: 出来的? 111.240.103.63 08/15 07:41
8F:推 robin101246: 十几年啦 typo吧 36.231.164.119 08/15 08:39
9F:推 zonppp: 遥遥领先~ 36.226.199.209 08/15 09:28
10F:→ jatj: 2F 吹太明显啦 夸大对手是常用手法但是要先G 122.118.9.47 08/15 09:53
11F:→ jatj: oogle喔 122.118.9.47 08/15 09:53
12F:推 NexusPrime: 市值第一的实力啊,哪可能这麽简单 49.216.130.56 08/15 12:45
13F:嘘 Peter911: NV强有什麽用 美国有刷脸付款贩卖机吗 # 42.72.49.93 08/15 15:11
14F:→ Peter911: 遥遥领先 42.72.49.93 08/15 15:11
16F:→ yunf: 的事情台湾自己都快管不了了 49.218.143.231 08/15 15:35
17F:→ yunf: 你国家级的软体资讯服务都要被瘫痪了 49.218.143.231 08/15 15:37
18F:→ leviathen: 对岸要取代cuda短期有难度的,毕竟是NV 192.184.219.91 08/18 14:15
19F:→ leviathen: 跟业界积累已久的底蕴,但给对岸五~十 192.184.219.91 08/18 14:15
20F:→ leviathen: 年的时间可能还真的能搞出自己的生态系 192.184.219.91 08/18 14:15
21F:→ leviathen: 。上面下令你不得不用,自然强迫所有人 192.184.219.91 08/18 14:15
22F:→ leviathen: 上去开发,猪头迟早也能改成诸葛亮.... 192.184.219.91 08/18 14:15