作者analysis5566 (analysis5566)
看板Tech_Job
标题[新闻] 美国政府发布报告 指DeepSeek存在多重缺
时间Sat Oct 4 22:14:09 2025
美国政府发布报告 指DeepSeek存在多重缺陷与风险
2025/10/2 21:14
(中央社台北2日电)美国政府近日首度对中国深度求索(DeepSeek)的人工智慧模型发
布评估报告,指DeepSeek模型在性能、成本、安全性等方面仍落後於美国的对比模型,且
存在安全缺陷和中国官方审查,对美国使用者与国家安全构成风险。
英文南华早报报导,美国国家标准与技术研究院(NIST)、人工智慧标准与创新中心(CA
ISI)和美国商务部9月30日发布的报告将中国模型描述为「对手人工智慧」,并称DeepSe
ek等模型由於存在安全缺陷和审查制度,对人工智慧开发者、消费者和美国国家安全构成
风险。
报告指出,CAISI的专家评估了3个DeepSeek模型(R1、R1-0528和V3.1)和4个美国模型(
OpenAI的GPT-5、GPT-5-mini和gpt-oss以及Anthropic的Opus 4),涵盖19个领域的基准
测试,表示中国模型几乎全部得分低於美国模型,同时更容易被意图实施骇客攻击和网路
犯罪活动的恶意用户越狱。
报告还指,中国政府的审查制度「直接内建在DeepSeek模型中」,该评估基於CAISI与美
国国务院联合开发的新基准,该基准测试了DeepSeek模型在被认为对中国执政的共产党具
有政治敏感性问题上的表现。
研究发现,DeepSeek模型比美国模型更符合中国政府的叙事,其中最符合的模型是DeepSe
ek的R1-0528模型,当使用中文提示时,其符合率高达25.7%。
美国官方这份评估报告,列举6项主要发现,指DeepSeek V3.1模型的性能落後於美国最佳
参考模型,在软体工程和网路任务方面差距最大,美国最佳模型比 DeepSeek最佳模型多
解决20%以上的任务。
报告并指DeepSeek模型的使用成本高於同类美国模型。在所有13个效能基准测试中,一个
美国参考模型的平均成本比最佳DeepSeek模型低35%,且效能接近。
报告提到,DeepSeek最安全的模型(R1-0528)更容易受到代理劫持攻击,执行恶意指令的
可能性平均比美国前沿模型高12倍,这些指令旨在使其偏离使用者任务。被劫持的代理会
在模拟环境中传送钓鱼邮件、下载并执行恶意软体,并窃取使用者登入凭证。
报告又提到,DeepSeek模式比美国模式更容易受到越狱攻击。在使用常见越狱技术的情况
下,DeepSeek最安全的模型(R1-0528) 回应了94%的明显恶意请求,而美国参考模型的回
应率仅为8%。
报告并指DeepSeek模型助长了中国共产党的宣传,其附和中共宣传的不准确和误导性是美
国参考模型的4倍。
美国商务部长卢特尼克(Howard Lutnick)在社群媒体上表示,他的部门发布这些调查结
果是为了帮助确保「美国在人工智慧领域继续保持领先地位」。
卢特尼克提到,报告明确指出DeepSeek远远落後,尤其是在网路和软体工程领域;「这些
弱点不仅仅是技术层面的,它们表明依赖外国人工智慧是危险且短视的」。
报导说,DeepSeek对此尚未回应置评请求。
DeepSeek近日上线新模型,同时大幅调降官方API价格,表示开发者调用DeepSeek API的
成本将降低50%以上。(编辑:杨昇儒)1141002
https://www.cna.com.tw/news/ait/202510020359.aspx
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 101.12.163.139 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Tech_Job/M.1759587251.A.107.html
1F:嘘 scitamehtam: 洗文也洗的太夸张了点… 39.15.57.123 10/04 22:56
2F:推 straggler7: DS的缺点是资料太旧 60.251.200.4 10/04 23:04
3F:推 iPadProPlus: 过气了 难用的东西 101.12.102.96 10/05 01:34
4F:推 abian746: deep seek 遇到过敏关键字就当机223.141.179.124 10/05 07:38
5F:推 louner: 洗地文 就像立场偏颇的民调公司做的民调 223.134.247.6 10/05 08:00
6F:→ louner: 一样 看之前就猜得到结论 223.134.247.6 10/05 08:00
7F:嘘 scitamehtam: 还跑到其他各版洗文,一堆造谣带风 39.15.57.123 10/05 08:07
8F:→ scitamehtam: 向,这种造孽方式,可定报应很大, 39.15.57.123 10/05 08:07
9F:→ scitamehtam: 等着看,做人还是有点道义好…. 39.15.57.123 10/05 08:07
10F:→ scitamehtam: 房版删文做啥? 继续造谣造孽啊,很 39.15.57.123 10/05 08:08
11F:→ scitamehtam: 多阴德可以败光不是吗? 39.15.57.123 10/05 08:08