作者pl132 (pl132)
看板Tech_Job
标题[新闻]DeepSeek-R1 模型升级新版本,推理能力接
时间Fri May 30 15:47:33 2025
DeepSeek-R1 模型升级新版本,推理能力接近 o3、Gemini 2.5 Pro
https://tinyurl.com/2bkshvbp
中国 DeepSeek(深度求索)释出 DeepSeek-R1-0528 模型新版本,使其免费开源模型在
推理能力能与 OpenAI o3、Google Gemini 2.5 Pro 等付费专有模型并驾齐驱。
DeepSeek-R1-0528 以 2024 年 12 月发表的 DeepSeek-V3-Base 为基础,在後训练(
Post-Training)过程投入更多算力,提升新版模型思考深度与推理能力,有助於提升数
学、科学、商业及程式设计等复杂推理任务上的表现。
DeepSeek-R1-0528 在数学、程式设计及通用逻辑等多个基准测试取得优异成绩,并在整
体表现上接近如 OpenAI o3、Google Gemini 2.5 Pro。
相较於旧版 DeepSeek-R1,新版模型在复杂推理任务的表现有所提升。例如 AIME 2025
测试,因推理过程中加强思考深度,新版模型准确率由旧版的 70% 提升至 87.5%。
同时,DeepSeek 蒸馏 DeepSeek-R1-0528 的 CoT(Chain of Thought)後训练
Qwen3-8B Base,得到了 DeepSeek-R1-0528-Qwen3-8B。这款 8B 模型在数学测验 AIME
2024 仅次於 DeepSeek-R1-0528、超越 Qwen3-8B,并与 Qwen3-235B 相当。DeepSeek 认
为,DeepSeek-R1-0528 的 CoT 对於学术界推理模型的研究和工业界针对小模型的发展皆
具意义。
https://is.gd/b5sIbD
与先前版本相同,DeepSeek-R1-0528 采用 MIT 授权条款,并上传至开源机器学习社群平
台 Hugging Face,开发者能够自由修改甚至进行商业部署。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.234.146.20 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Tech_Job/M.1748591261.A.B02.html
1F:推 lespacino : z,,,, ,喔,,我,,,, 122.121.26.5 05/30 16:38
2F:嘘 r4989872 : 继续吹吧 有open ai根本就不需要这 101.10.8.231 05/30 17:03
3F:→ r4989872 : 坨 101.10.8.231 05/30 17:03
4F:推 Homeparty : 之前幻觉大概70%,现在大概20%以下 101.9.36.148 05/30 17:28
5F:嘘 cityhunter04: 难用的东西 ,又慢 不能问的一堆 114.24.105.45 05/30 17:50
6F:嘘 NEWinx : 然後?会画图了吗? 1.172.81.21 05/30 17:50
7F:嘘 mercurycgt68: 比人家慢推出性能还没超过喔 不是很114.136.203.135 05/30 18:17
8F:→ mercurycgt68: 秋?114.136.203.135 05/30 18:17
9F:推 abbei : nobody car 无人车 36.228.12.5 05/30 19:17
10F:推 a731977 : MIT我是真的服,META还要自己的LIC 101.10.75.231 05/30 21:31
12F:嘘 inunoya : 难用111.249.204.150 05/30 22:16
13F:→ wbw : 8964114.136.131.216 05/30 22:23
14F:推 CoNsTaR : 这里的风向和 reddit 也差太多 111.82.27.182 05/30 22:35
15F:推 CoNsTaR : 现在的风向不是 deepseek 才是真正 111.82.27.182 05/30 22:38
16F:→ CoNsTaR : 的 open ai,open ai 应该叫 closed 111.82.27.182 05/30 22:38
17F:→ CoNsTaR : ai 吗 111.82.27.182 05/30 22:38
18F:推 eruption0214: 开源 42.75.156.40 05/30 22:44
19F:推 godog : 70 vs 68 中美AI的差距又缩小了 难 118.231.161.73 05/30 22:55
20F:→ godog : 怪黄说中国AI没有输美国 一直紧跟 118.231.161.73 05/30 22:55
21F:→ godog : 在後 118.231.161.73 05/30 22:55
22F:推 havochuman : 风向啥的能吃吗 就问你平常用哪个 122.11.212.141 05/30 23:10
23F:→ havochuman : 该不会是deepseek八 嘻嘻 122.11.212.141 05/30 23:10
24F:推 jhjhs33504 : 现在开源的都是试玩版 不知哪时才能 1.162.84.180 05/30 23:56
25F:→ jhjhs33504 : 内建在本机系统里?不然搞得好像韭菜 1.162.84.180 05/30 23:57
26F:嘘 fantasyhorse: 使用率这麽低还好意思吹 36.225.50.168 05/31 00:20
27F:→ iPadProPlus : 过气 111.71.213.108 05/31 01:34
28F:嘘 ohohohya : 蒸馏人家永远无法超车 111.80.36.174 05/31 03:43
29F:→ ohohohya : 没差继续烧钱就跟电车暴雷一样 111.80.36.174 05/31 03:44
30F:嘘 oboesoul : 台湾只有蓝白粉在推.. 101.10.156.113 05/31 09:17
31F:嘘 gary861226 : 楼上言论大可不必 101.10.217.214 05/31 09:24
32F:推 squelch : 嘻嘻 我用deepseek 42.70.129.182 05/31 15:56
33F:→ teddy : 开源来说还是很屌了 有钱的公司就自 27.53.160.57 05/31 17:45
34F:→ teddy : 己组设备架在内部了 27.53.160.57 05/31 17:45
35F:推 zxp9505007 : 用OpenAI 又看不到Weight跟架构 这174.194.198.112 06/01 02:55
36F:→ zxp9505007 : 点DS大胜174.194.198.112 06/01 02:55
37F:嘘 CCNCCN : 继续吹 203.74.156.121 06/02 00:12
38F:推 jobintan : 不得不说,我原本用ChatGPT,後来 43.252.167.94 06/03 09:25
39F:→ jobintan : 都大多使用DeepSeek。 43.252.167.94 06/03 09:25
40F:推 dpew : 一开始全世界都很惊奇,时间长了,223.136.144.110 06/03 13:34
41F:→ dpew : 就知烂的可以223.136.144.110 06/03 13:34