Tech_Job 板


LINE

很多國外新聞這幾天比較專業的都是關注在DeepSeek的新論文,詳細列出了很多DeepSeek技 術細節如何省流的數據,像是KV Cache的成本還有透過軟體整合協同提升硬體的使用效率( 3F S無疑是工藝品的等級),揭露了未來減少GPU、Disk跟CPU之間的通訊無疑是下一個軟硬整 合加速指標。 當前開源生態甚至是Gemini都已經將DeepSeek的GRPO當作模型對齊Reasoning的新範式了, 實際也是證明很好用有效又省錢,最近也是蠻多篇Paper探討Reward作為一種弱監督信號為 什麼有用又不會像DPO一樣會過度擬合訓練數據的好處。題外話,連NVIDIA 的Nemotron最新 一代也採用這樣的Post training 新範式。 然後文章沒揭露的是很多閉源模型當前為了alignment最新的時事資料或基於用戶反饋的校 正成本,實際上谷歌、Claude跟OpenAI在這塊的維護上每年都要虧損十幾億美金,這東西是 很多小企業維護不來的。 然後GPU的Infra群集這幾年也是不斷在往上增加,反而訓練的成本才是往下掉的。谷歌跟Op enAI為了維持服務響應花費的不比訓練建構的群集還要少。 我個人認為這種文章針對性蠻強的,重點也不是在DeepSeek系統架構上的缺失,真的要我說 的話,當前DeepSeek比較大的問題是市場上具有Reasoning的LLM競品在DS開源方法以後開始 暴增,但DeepSeek沒有資源來調優當前自己的R1模型(畢竟公司多數都是研究員,可以看出 團隊會更想把精力花費在研究上)。 然後實際上普通人對Reasoning的需求就不大(吉卜力會爆紅顯示普通人對AI的期望會更像 有趣的玩具),企業有資源的會選擇自己建構,沒資源的會採用Agent方式讓多個響應比較 快的模型建構特定場景的任務替代Reasoning LLM。 差不多4醬 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.109.14 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Tech_Job/M.1747480919.A.242.html
1F:→ keter007 : 難用,微調成本極高,搞死用戶123.192.217.254 05/17 19:37
2F:推 cityhunter04: 對使用者來說,難用就不會有人用!114.24.92.6 05/17 19:43
3F:→ cityhunter04: 實用性才是AI的重點…114.24.92.6 05/17 19:43
※ 編輯: sxy67230 (101.10.109.14 臺灣), 05/17/2025 20:08:25
4F:→ theedge : 難用就不會有人用? 那Linux呢? 42.73.60.185 05/17 21:45
5F:→ DrTech : 難得認真文。普通人誰管你reasoning 42.73.94.186 05/17 22:10
6F:→ DrTech : ,直接給我出個有趣的圖比較有用42.73.94.186 05/17 22:10
7F:→ DrTech : inference scaling law 研究性質遠42.73.94.186 05/17 22:14
8F:→ DrTech : 超過實用性質42.73.94.186 05/17 22:14
9F:推 JoSue : 推111.241.128.249 05/17 22:42
10F:噓 flinch : 無黃金錨定的美元 不配叫美金42.70.91.247 05/17 23:25
11F:推 questionboy : 認真文 推114.45.60.220 05/17 23:25
12F:推 zyliu : 推認真文218.35.15.123 05/18 01:22
13F:推 pponywong : Linux 其實在工程上不難用阿 118.160.135.12 05/18 07:42
14F:→ pponywong : 同樣開發軟體 Linux 方便太多了 118.160.135.12 05/18 07:43
15F:推 DA3921999 : DS最大的問題就是直接開源教大家怎27.53.147.72 05/18 13:12
16F:→ DA3921999 : 麼做,這樣一來一回註定輸偷吉卜力 27.53.147.72 05/18 13:12
17F:→ DA3921999 : 的 27.53.147.72 05/18 13:12
18F:噓 ImHoluCan : 好的叫deepseek生成個吉卜力來,不111.83.87.172 05/18 16:50
19F:→ ImHoluCan : 然就畢嘴111.83.87.172 05/18 16:50
文組網軍有夠可憐的,談技術不懂技術難怪年薪不到百萬:) ※ 編輯: sxy67230 (101.10.109.14 臺灣), 05/18/2025 18:06:11 ※ 編輯: sxy67230 (101.10.109.14 臺灣), 05/18/2025 18:07:48
20F:推 TameFoxx : 如果企業要選落地的模型 現在只能選 58.114.188.80 05/18 21:59
21F:→ TameFoxx : 中國的 58.114.188.80 05/18 22:00
22F:推 jamesho8743 : Linux對工程師來說又不難用 它也不 27.53.25.95 05/19 19:12
23F:→ jamesho8743 : 是給一般人用的 27.53.25.95 05/19 19:12
24F:→ jamesho8743 : 公司電腦天天都在用Linux 除了遊戲 27.53.25.95 05/19 19:15
25F:→ jamesho8743 : 感覺不出跟Windows有什麼差別 反正 27.53.25.95 05/19 19:15
26F:→ jamesho8743 : 你要的大概就是瀏覽器 27.53.25.95 05/19 19:15
27F:噓 CCNCCN : 原來還有人不知道這炒股用 203.74.156.121 05/22 09:19







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Gossiping站內搜尋

TOP