AI_Art 板


LINE

https://www.youtube.com/watch?v=jnTSGk0gi5c
以下是這部 GPT 5.2 評測影片的重點摘要,總結了其新功能、實際演示結果以及與競品 的比較: 1. 核心亮點與定位 最強模型之一:GPT 5.2 被 OpenAI 宣稱為「最適合專業知識工作」的模型。 版本:影片中測試的是 GPT 5.2 Thinking(思考模式),這是性能最強的變體。 付費限制:目前僅限 Plus 等付費訂閱用戶使用,免費用戶無法存取。 知識庫更新:知識截止日期為 2025 年 8 月,比許多競品更新。 2. 實際演示與能力測試 影片展示了多個高難度的 Prompt 測試,結果如下: HTML/JS 程式編碼能力(極強): 蜂巢模擬:成功生成包含工蜂路徑、蜂蜜儲存的視覺化模擬。與 Gemini 3 相比 ,GPT 5.2 的模擬更符合物理現實(蜜蜂從單一入口進出)。 Photoshop 複刻版:僅用 19 秒就寫出了一個功能完整的網頁版 Photoshop,包 含圖層、筆刷(可調硬度/透明度)、濾鏡(模糊/銳化/灰階)、混合模式( Overlay/Multiply)和編輯歷史,功能全部可用且無 bug。 Windows 11 複刻版:生成了包含功能性 Word、Excel(支援公式計算)、 PowerPoint(可新增投影片、播放簡報)的桌面模擬。雖然 UI 不完美,但功能性遠勝 Gemini 3 Pro(後者生成的 Excel 無法操作)。 3D 光線追蹤模擬:成功生成兩個金屬球懸浮在街道上的 3D 場景,且球體之間 能互相反射(物理正確),這是之前模型無法做到的。 3D 星空圖:一次生成可互動的 3D 星座圖,標籤與星座形狀(如北斗七星)大 致正確。 視覺辨識與多模態能力: 動漫角色辨識:能準確辨識並標註《鬼滅之刃》中的多個角色。 尋找威利 (Where's Waldo):透過撰寫 Python 程式碼來掃描圖片,耗時 13 分 鐘後成功找到威利,展現了強大的工具使用與問題解決能力。 複雜表格轉 Excel:能處理結構極其複雜、有缺失儲存格的巢狀表格,並完美轉 換為試算表。 流程圖轉代碼:能將複雜流程圖轉換為可編輯的 canvas,文字與顏色正確,但 箭頭連接上有少量錯誤。 弱點:在「尋找隱藏青蛙」和「醫療影像病灶標註」的測試中表現不佳,與 Gemini 3 Pro 一樣未能正確識別。在地理位置猜測(Geo-guessing)上,雖未完全命中 ,但比 Gemini 3 Pro 更接近真實位置。 3. 基準測試 (Benchmarks) 與競品比較 GDP Val:在涵蓋 44 種職業任務的測試中,GPT 5.2 是首個在超過 50% 的時間內表 現優於人類專家的模型。 ARC-AGI 2:在測試「學習新模式能力」的指標上得分 52.9%,顯著優於 Gemini 3 Pro,顯示其適應未知問題的能力更強。 SWE-bench Pro:OpenAI 採用了更難的 "Pro" 版本測試,顯示其優於 Claude Opus 4.5 和 Gemini 3 Pro。但在舊版的 "Verified" 測試中,GPT 5.2 未必領先。 長文本能力:在 256k tokens(約 20 萬字)的長文本測試中,準確率接近 100%。 但其最大上下文窗口為 400k tokens,低於 Gemini 3 的 100 萬 tokens。 第三方排名: 在 Artificial Analysis 排行榜上,GPT 5.2 Extra High 與 Gemini 3 Pro 並 列第一。 價格方面,每百萬 token $4.8 美元,比 Gemini 3 Pro 稍貴,但遠便宜於 Claude Opus 4.5。 在幻覺率(Hallucination Rate)上,GPT 5.2 表現中等(78% 錯誤率),優 於 Gemini 3 Pro,但不如 Grok 4 或 Kimi k2。 總結 GPT 5.2 是一個非常強大的模型,特別是在複雜編碼(能寫出功能完整的應用程式)和邏 輯推理方面表現突出。雖然在某些視覺識別任務上仍有進步空間,但整體實力與 Gemini 3 Pro 處於伯仲之間,是目前市場上的頂級選擇。 -- gemini3整理 競爭對手都說伯仲之間了應該不弱 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.245.116 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/AI_Art/M.1765857948.A.19E.html
1F:→ error405: 這頻道有料但影片好長 先做摘要再倍速跳著看比較快 12/16 12:14
2F:推 ct13579: 看明年的grok5能否頂足而三 12/16 12:28
3F:推 Supasizeit: 證明了headless video也是有人看 12/16 13:20
4F:→ error405: (天天刷低能short) 12/16 13:38







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:BuyTogether站內搜尋

TOP