作者pl132 (pl132)
看板Tech_Job
標題[新聞]DeepSeek-R1 模型升級新版本,推理能力接
時間Fri May 30 15:47:33 2025
DeepSeek-R1 模型升級新版本,推理能力接近 o3、Gemini 2.5 Pro
https://tinyurl.com/2bkshvbp
中國 DeepSeek(深度求索)釋出 DeepSeek-R1-0528 模型新版本,使其免費開源模型在
推理能力能與 OpenAI o3、Google Gemini 2.5 Pro 等付費專有模型並駕齊驅。
DeepSeek-R1-0528 以 2024 年 12 月發表的 DeepSeek-V3-Base 為基礎,在後訓練(
Post-Training)過程投入更多算力,提升新版模型思考深度與推理能力,有助於提升數
學、科學、商業及程式設計等複雜推理任務上的表現。
DeepSeek-R1-0528 在數學、程式設計及通用邏輯等多個基準測試取得優異成績,並在整
體表現上接近如 OpenAI o3、Google Gemini 2.5 Pro。
相較於舊版 DeepSeek-R1,新版模型在複雜推理任務的表現有所提升。例如 AIME 2025
測試,因推理過程中加強思考深度,新版模型準確率由舊版的 70% 提升至 87.5%。
同時,DeepSeek 蒸餾 DeepSeek-R1-0528 的 CoT(Chain of Thought)後訓練
Qwen3-8B Base,得到了 DeepSeek-R1-0528-Qwen3-8B。這款 8B 模型在數學測驗 AIME
2024 僅次於 DeepSeek-R1-0528、超越 Qwen3-8B,並與 Qwen3-235B 相當。DeepSeek 認
為,DeepSeek-R1-0528 的 CoT 對於學術界推理模型的研究和工業界針對小模型的發展皆
具意義。
https://is.gd/b5sIbD
與先前版本相同,DeepSeek-R1-0528 採用 MIT 授權條款,並上傳至開源機器學習社群平
台 Hugging Face,開發者能夠自由修改甚至進行商業部署。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.234.146.20 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Tech_Job/M.1748591261.A.B02.html
1F:推 lespacino : z,,,, ,喔,,我,,,, 122.121.26.5 05/30 16:38
2F:噓 r4989872 : 繼續吹吧 有open ai根本就不需要這 101.10.8.231 05/30 17:03
3F:→ r4989872 : 坨 101.10.8.231 05/30 17:03
4F:推 Homeparty : 之前幻覺大概70%,現在大概20%以下 101.9.36.148 05/30 17:28
5F:噓 cityhunter04: 難用的東西 ,又慢 不能問的一堆 114.24.105.45 05/30 17:50
6F:噓 NEWinx : 然後?會畫圖了嗎? 1.172.81.21 05/30 17:50
7F:噓 mercurycgt68: 比人家慢推出性能還沒超過喔 不是很114.136.203.135 05/30 18:17
8F:→ mercurycgt68: 秋?114.136.203.135 05/30 18:17
9F:推 abbei : nobody car 無人車 36.228.12.5 05/30 19:17
10F:推 a731977 : MIT我是真的服,META還要自己的LIC 101.10.75.231 05/30 21:31
12F:噓 inunoya : 難用111.249.204.150 05/30 22:16
13F:→ wbw : 8964114.136.131.216 05/30 22:23
14F:推 CoNsTaR : 這裡的風向和 reddit 也差太多 111.82.27.182 05/30 22:35
15F:推 CoNsTaR : 現在的風向不是 deepseek 才是真正 111.82.27.182 05/30 22:38
16F:→ CoNsTaR : 的 open ai,open ai 應該叫 closed 111.82.27.182 05/30 22:38
17F:→ CoNsTaR : ai 嗎 111.82.27.182 05/30 22:38
18F:推 eruption0214: 開源 42.75.156.40 05/30 22:44
19F:推 godog : 70 vs 68 中美AI的差距又縮小了 難 118.231.161.73 05/30 22:55
20F:→ godog : 怪黃說中國AI沒有輸美國 一直緊跟 118.231.161.73 05/30 22:55
21F:→ godog : 在後 118.231.161.73 05/30 22:55
22F:推 havochuman : 風向啥的能吃嗎 就問你平常用哪個 122.11.212.141 05/30 23:10
23F:→ havochuman : 該不會是deepseek八 嘻嘻 122.11.212.141 05/30 23:10
24F:推 jhjhs33504 : 現在開源的都是試玩版 不知哪時才能 1.162.84.180 05/30 23:56
25F:→ jhjhs33504 : 內建在本機系統裡?不然搞得好像韭菜 1.162.84.180 05/30 23:57
26F:噓 fantasyhorse: 使用率這麼低還好意思吹 36.225.50.168 05/31 00:20
27F:→ iPadProPlus : 過氣 111.71.213.108 05/31 01:34
28F:噓 ohohohya : 蒸餾人家永遠無法超車 111.80.36.174 05/31 03:43
29F:→ ohohohya : 沒差繼續燒錢就跟電車暴雷一樣 111.80.36.174 05/31 03:44
30F:噓 oboesoul : 台灣只有藍白粉在推.. 101.10.156.113 05/31 09:17
31F:噓 gary861226 : 樓上言論大可不必 101.10.217.214 05/31 09:24
32F:推 squelch : 嘻嘻 我用deepseek 42.70.129.182 05/31 15:56
33F:→ teddy : 開源來說還是很屌了 有錢的公司就自 27.53.160.57 05/31 17:45
34F:→ teddy : 己組設備架在內部了 27.53.160.57 05/31 17:45
35F:推 zxp9505007 : 用OpenAI 又看不到Weight跟架構 這174.194.198.112 06/01 02:55
36F:→ zxp9505007 : 點DS大勝174.194.198.112 06/01 02:55
37F:噓 CCNCCN : 繼續吹 203.74.156.121 06/02 00:12
38F:推 jobintan : 不得不說,我原本用ChatGPT,後來 43.252.167.94 06/03 09:25
39F:→ jobintan : 都大多使用DeepSeek。 43.252.167.94 06/03 09:25
40F:推 dpew : 一開始全世界都很驚奇,時間長了,223.136.144.110 06/03 13:34
41F:→ dpew : 就知爛的可以223.136.144.110 06/03 13:34