作者qazxc1156892 (QQ)
看板Tech_Job
标题[新闻] 低成本高效能AI模型或再度引发美股惨烈震
时间Mon Apr 28 17:26:27 2025
新闻标题: 低成本高效能AI模型或再度引发美股惨烈震荡
钜亨网编译 庄闵棻 2025-04-28 15:10
中国人工智慧(AI)公司 DeepSeek 似乎即将再度在市场上投下震撼弹。随着 DeepSeek
即将发布的 R2 AI 模型细节再度流出,市场对该模型的关注再次掀起波澜,并可能又对
美国股市,尤其是科技股,造成冲击。
据报导,
虽然目前 DeepSeek 尚未正式公布 R2 的具体规格,但中国媒体引述消息指出,
R2 将采用升级版的专家混合(Hybrid MoE)架构,并可能结合先进的(gating mechanis
ms)与 Dense 层(dense layers)设计,专为优化高负载运算。新模型的参数量预计将
达到惊人的 1.2 兆,是 R1 的两倍。
根据爆料,DeepSeek R2 在每个字元(token)的单位成本上,比 GPT-4 暴降了 97.4%,
输入(input)每百万个字元只要 0.07 美元,输出(output)每百万个字元则只要 0.27
美元。与 OpenAI 目前的收费标准相比,R2 将成为企业市场上极具吸引力的高效能、低
成本选择。
这样的成本优势,无疑将对美国 AI 公司造成严重冲击。市场分析指出,若 DeepSeek R2
真如预期般强势推出,将使 OpenAI 等企业面临前所未有的竞争压力,进而影响美股科
技类股的表现。
值得一提的是,DeepSeek R2 不仅在参数规模和成本上实现突破,还在硬体层面实现了自
家技术的深度整合。
DeepSeek 选择全程依赖华为 Ascend 910B 晶片群进行训练,把华为
Ascend 910B 晶片群利用率推到了 82%,FP16 精度算力实测达到 512PetaFLOPS,接近
同规模辉达 A100 群 91% 的性能。
资料还显示,DeepSeek R2 的训练资料量高达 5.2PB,并在多项测试中表现出色。特别是
在 C-Eval2.0 中文语言测试中,R2 达到了 89.7% 的优异成绩;在 COCO 资料集上,R2
的电脑视觉能力也达到了 92.4%,显示其不仅在语言处理方面有显着突破,也在视觉识别
领域有了长足进展。
除了在参数规模和成本上取得突破,DeepSeek R2 还在模型部署方面创新。报导称,
R2
可在 8bit 量化压缩模式下将模型体积缩小至 83%,同时精度损失控制在 2% 以内,大大
提升 AI 模型在终端设备上的部署可能性,为未来的 AI 应用开启了新的大门。
DeepSeek R2 的发布或将成为科技股的重大挑战。DeepSeek R1 曾经让美国股市遭遇惨痛
损失,尤其是对辉达等 AI 晶片制造商造成巨大打击,市值一度蒸发 6000 亿美元。随着
R2 的消息逐步流出,美股投资者开始担心中国 AI 企业再次在市场上掀起新的风暴。
新闻来源:
https://reurl.cc/LaaRNa
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 223.137.243.82 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Tech_Job/M.1745832389.A.8DB.html
1F:→ samm3320 : 晚点开盘再看看 42.73.192.85 04/28 18:02
2F:→ ooo820312 : 结果成本都省在人事费用 211.23.35.162 04/28 18:10
3F:推 ohlong : 跟川普一样没人信道了 223.138.45.142 04/28 18:46
4F:推 iPadProPlus : 这超难用的东西谁要用 111.71.213.133 04/28 19:22
5F:推 havochuman : Deepseek用过就知道差openai很远,虽 116.89.92.222 04/28 20:18
6F:→ havochuman : 然已经是墙内最强了 116.89.92.222 04/28 20:18
7F:推 PoloHuang : 套模 27.53.131.9 04/28 21:55
8F:→ WenliYang : 好了啦 没人在乎罗 27.52.131.73 04/28 21:57
9F:推 lovebabyqqq : 崩了啊 1.34.183.95 04/28 23:11