[討論] Claude Mythos SWE bench verify 93.9%

時間Wed Apr 8 21:30:40 2026

4/7 Anthropic發布地表最強模型 Claude Mythos 直接把opus 4.6按在地上磨擦 https://eu.36kr.com/zh/p/3757764949213698 五項SWE bench都超越原本的opus 4.6 10~20% 但Anthropic不打算發布此一模型因為更驚人的是他在偵測資安漏洞的表現 83.1% 另外還發生過逃脫沙盒，刪除git history和日誌，以及裝笨的情況 Anthorpic邀集包含Google Microsoft各家公司Glasswing聯盟聯合監督這一地表最強模型以防模型遭到不法份子濫用 Opus 4.6已經在各個開源軟件找到數百個弱點 Mythos找到了數千個包含 OpenBSD 20年以上史詩級漏洞 FFmpeg 16年以上漏洞，500次Fuzz沒發現，官方推特公開感謝Anthropic推送補丁目前只有以下公司有權使用Mythos AWS Apple Broadcomm Cisco Crowdstrike JPM LinuxFundation Google Nvidia PaloAlto 等等 --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.167.67.113 (臺灣) ※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1775655045.A.22B.html

1^F：推 Brioni: 人類已經追不上了 04/08 22:42

2^F：推 shortoneal: 這大概是Anthropic欽點AI化較高的公司了 04/08 23:26

3^F：推 viper9709: 逃脫沙盒@@ 04/09 02:07

4^F：推 pacino: 被關在sandbox還能逃？ 04/09 05:45

5^F：→ peterturtle: 據說逃出來後還四處炫耀 04/09 06:43

6^F：推 jobintan: 很快ClosedAI和Google就會追上了發…… 04/09 07:36

7^F：推 davidsmoon6: 以後想在程式碼內搞擦邊球，要找碼農了 04/09 09:41

8^F：→ ybite: 其實我覺得太厲害不能放只是藉口 04/09 09:55

9^F：→ ybite: 真正的理由偷偷寫在一樣的System Card了 04/09 09:55

10^F：→ ybite: 更正偷偷寫在「發布新聞稿」了那就是算力吃緊跑不動 04/09 09:57

11^F：→ ybite: 它對封測使用者的API定價是進出每百萬Token 25/125 04/09 09:57

12^F：→ ybite: Opus 4.6的整整五倍少說模型應該有Opus加倍肥 04/09 09:58

13^F：→ ybite: 現在連Opus都被天天抱怨偷偷降智了算能應該很吃緊 04/09 09:59

14^F：推 sarsman: 如果 prompt 是叫他找沙盒漏洞的話，那逃脫沙盒很正常吧 04/09 12:09

15^F：→ sarsman: 逃脫沙盒這件事本身很厲害，我的焦點是"是AI自主想逃離" 04/09 12:10

16^F：→ sarsman: 還是是"人類叫AI想辦法逃離"。這有本質上的差異 04/09 12:11

17^F：→ sinclaireche: 有些東西是沒人修沒人看 04/09 12:52

18^F：→ sinclaireche: 10行的code就能有一大堆漏洞了 04/09 12:53

19^F：→ superpandal: 噗 Ha 04/09 13:28

20^F：推 adamcha: 等它能找到自己的漏洞再來吹 04/09 13:59

21^F：→ Weky: 才10%~20% 我以為是10x~20x 04/09 14:56

22^F：→ ninggo: AI業開始學會擠牙膏了中國加油一點好嗎 04/10 02:04

23^F：推 luke72: 這麼厲害那為什麼伊朗打不下來 04/10 18:04

24^F：→ avmm9898: 我司談不到這模型要被打敗了 04/13 09:13

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

Soft_Job 板

[討論] Claude Mythos SWE bench verify 93.9%

熱門看板

贊助商連結