MobileComm 板


LINE

※ [本文轉錄自 Stock 看板 #1eJk0_y9 ] 作者: huabandd (我是阿肥巴你頭) 看板: Stock 標題: [心得] 蘋果揭露人工智能並不思考 時間: Sun Jun 15 23:01:12 2025 https://is.gd/U7lWC8 看到一個影片,非新聞報導,僅創作者想法 討論蘋果揭露關於人工智能當中的最大謊言 之前也看過一個影片指出 AI無法產出指針在10:10以外的手錶 (網路手錶圖片通常指針停留在10:10) 自己嘗試過幾次確實是這樣 因為AI的訓練是基於現有大量資料 去產生一個與大量資料相似的產物給你 無法產生未曾有過資料的產物 (以上為個人猜測,若錯誤請指正) 雖然現在已有研究嘗試將AI接入人類神經元 未來思考的方式有可能因此改變 不再只是記憶,而是真正的推理 (但是這好像也是一件滿恐怖的事情?) 如果說給AI一個圍棋組,但不教他玩法 也不讓他參考棋類玩法,讓他自行摸索 就像嬰兒拿到玩具後自己亂玩那樣 AI能夠自行生成玩法是不是就算是成功? 中文翻譯 蘋果剛剛揭露了人工智慧中最大的謊言,即「思考」的假象,證明了像 Claude、Deepseek- R1 和 OpenAI 的 o3-mini 等推理模型實際上並不會思考。蘋果沒有重複使用舊有的數學問 題,而是創造了這些模型從未見過全新謎題。結果令人震驚。 對於簡單問題,標準 AI 模型表現優於昂貴的推理模型,同時消耗更少的資源。對於中等複 雜度問題,推理模型顯示出一些優勢,但對於模擬現實世界情境的高複雜度問題,兩種類型 的模型都崩潰到 0% 的準確度。 這是確鑿的證據:蘋果給予 AI 模型逐步的演算法,就像給某人食譜一樣,但它們仍在相同 的門檻下失敗了。這證明它們無法遵循邏輯指令。該研究沒有發現任何形式推理的證據,得 出結論認為其行為最好用複雜的模式匹配來解釋。 簡單地更改名稱和問題會顯著降低性能。蘋果測試了河內塔(Tower of Hanoi)謎題,模型 在超過 100 步的移動中成功了,但在新穎的渡河謎題中僅僅 4 步後就失敗了。它們是記憶 模式,而不是進行邏輯推理。 隨著問題變得越來越難,「思考」模型使用的 token 越來越少,放棄得更快,而不是更深 入地思考。即使無限的計算資源也無濟於事。這揭示了數十億美元的 AI 投資是建立在錯誤 前提上的。 公司將複雜的模式匹配宣傳為真正的推理,誤導消費者對 AI 能力的認知。我們離通用人工 智慧(AGI)的距離並沒有大家想像的那麼近;我們正在處理的是非常複雜的自動完成系統 。當先進的 AI 推理模型連遵循簡單指令都失敗時,我們是否正生活在一個建立在幻想之上 的 AI 炒作泡沫中? 英文原文 Apple just exposed the biggest lie in AI with the illusion of "thinking," provin g that reasoning models like Claude, Deepseek-R1, and OpenAI's o3-mini don't act ually think. Instead of recycling math problems, Apple created brand new puzzles these models had never seen. The results were shocking. For simple problems, standard AI models outperformed expensive reasoning models while using fewer resources. For medium complexity, reasoning models showed some advantage, but for high complexity problems that mirror real-world scenarios, b oth types collapsed to 0% accuracy. Here's the damning evidence: Apple gave AI models step-by-step algorithms, like giving someone a recipe, and they still failed at the same thresholds. This prov es they can't follow logical instructions. The study found no evidence of formal reasoning, concluding behavior is better explained by sophisticated pattern mat ching. Simply changing names and problems degraded performance dramatically. Apple test ed Tower of Hanoi puzzles, where models succeeded with 100-plus moves but failed at novel river crossing puzzles after just 4 moves. They memorized patterns rat her than reasoned logically. As problems got harder, "thinking" models used fewer tokens and gave up faster i nstead of thinking deeper. Even unlimited computational resources couldn't help. This exposes that billions in AI investment are based on false premises. Companies market sophisticated pattern matching as genuine reasoning, misleading consumers about AI capabilities. We are not as close to AGI as everyone thinks; we're dealing with very sophisticated autocomplete systems. When advanced AI re asoning models fail at following simple instructions, are we living in an AI hyp e bubble built on illusions? --



※ 發信站: 批踢踢實業坊(ptt.cc)
※ 轉錄者: Kai877 (27.240.233.101 臺灣), 06/16/2025 12:48:36 ※ 編輯: Kai877 (27.240.233.101 臺灣), 06/16/2025 12:49:23
1F:推 barkids : 做不出來,先打預防針:都是假的!AI其實沒那麼好 06/16 12:55
2F:→ barkids : 蘋果才是先知,哈哈哈 XXD 06/16 12:57
3F:推 answer012103: 不是我們不做 是我們不做爛東西 06/16 13:17
4F:推 s213092921 : NOKIApple 06/16 13:30
5F:→ a27588679 : 看來蘋果打算推出真正會思考的ai一舉超越其他競品? 06/16 13:35
6F:推 keineAhnung : 原來是人工智能 我還以為是蘋果用戶 06/16 13:39
7F:推 ncuephysics : 重新定義 06/16 13:40
8F:推 foolwind : 官方認證AI沒用 果又贏 06/16 13:41
9F:→ JuiFu617 : 不會思考就這麼強,會思考還得了 06/16 13:43
10F:→ JuiFu617 : 作為工具,我寧願他永遠不會思考 06/16 13:46
11F:→ JuiFu617 : https://i.imgur.com/YxJUPJb.jpeg 06/16 13:48
12F:→ nekoares : 應該說你怎麼定義思考 06/16 13:54
13F:噓 astrofluket6: 能智 06/16 14:05
14F:→ square4 : 抖音影片把蘋果研究反著寫也真是厲害,還是看正經 06/16 14:10
15F:→ square4 : 報導吧https://reurl.cc/XAzdb3 06/16 14:10
16F:推 tetani : ai只是統計學的大數據應用而已 06/16 14:12
17F:推 Wardyal : 這不是早就知道的事情嗎 06/16 14:25
18F:推 tktk1212 : 會思考感覺很可怕 現在這樣就可以了 06/16 14:29
19F:→ widec : 蘋果是說AI沒「推理」不是思考吧 06/16 14:30
20F:→ widec : 然後這篇論文不是被打臉亂寫了嗎 06/16 14:31
21F:噓 MisterSmile : 你那邊做空美元還來得及 06/16 14:31
22F:→ widec : AI這麼笨不會推理卻可以解開一些人類解不開的數學? 06/16 14:32
23F:→ widec : 用大腿想都知道這篇結論很奇怪 06/16 14:33
24F:噓 cstease64 : 這篇早就被打臉了 老哥 06/16 14:36
25F:→ JuiFu617 : https://i.imgur.com/OLhqxZF.jpeg 06/16 15:04
26F:→ Crios : 蘋果說的都是對的 不可質疑 沒錯~ 06/16 15:11
27F:推 graphict : 本來就是,AI就是噱頭居多 06/16 15:20
28F:推 maninpink : 現在這年頭居然還有人認為AI是噱頭... 06/16 15:29
29F:推 doom3 : AI發新版本比手機出新機還快 現在沒有不代表未來沒 06/16 15:42
30F:→ manbow77 : 目前雖然還是深度學習大數據 但潛在應用已經非常廣 06/16 15:45
31F:→ eric78659 : 現在生成式AI一直都是舊有資料去生啊,生不出新東西 06/16 16:10
32F:推 wujet09100 : 蘋果玩文字接龍玩書其他公司 然後乾脆直接說其他公 06/16 16:12
33F:→ wujet09100 : 司發展方向都錯了 嘻嘻 06/16 16:12
34F:推 j0958322080 : 重新定義 AI 06/16 17:12
35F:噓 piyopiyolee : 你撥接歐!Nvidia都發一篇打臉了 06/16 17:23
36F:噓 basacola : 這誰不知道 06/16 17:55
37F:推 ww : 就跟某些念過很多書 說的頭頭是道的人一樣 遇見沒 06/16 17:58
38F:→ ww : 看過的問題就傻了 06/16 17:58
39F:推 aasssdddd : ai可以寫大家都看的懂的搜死扣 聽起來不是很棒嗎 06/16 18:11
40F:→ alan3100 : 可憐 沒創新被創新打趴 還在那雞蛋挑骨頭XD 06/16 18:19
41F:推 teasy : 那去年狂打AI 的iPhone 不就是唬爛的 06/16 18:30
42F:推 issemn : 原來是說人工智能 我還以為是說果粉 06/16 19:15
43F:推 aotom : 這不就廢話嗎?離AGI當然還有一段距離 06/16 19:30
44F:→ xixixxiixxii: 叫ai做事要給精確指令 06/16 19:31
45F:推 f396761440 : 一家手機廠的文章搞得很像報紙的社論文 06/16 19:35
46F:→ f396761440 : 在檢討其他公司的AI技術時, 而自己卻搞不出來 06/16 19:35
47F:噓 markmao : 通篇廢話 AGI本來就剛起步 不用水果揭露 更不需要一 06/16 19:44
48F:→ markmao : 個來路不明的人自以為戳破泡泡 06/16 19:44
49F:→ Numenor : AI發展已經走歪了大量的運算都浪費在幹話瞎掰上, 06/16 21:47
50F:→ Numenor : 泡泡不戳破只會走的更歪 06/16 21:47
51F:→ moon999tw : 阿婆 加油 好嗎 06/16 21:48
52F:推 aikolove : 就你最沒資格嘴 06/16 21:53
53F:→ A5Watamate : 但是人類的思考也是從自己知識中尋找最佳解答啊… 06/16 22:09
54F:噓 DALLEN : 所以AI SIRI做完沒? 06/16 22:22
55F:→ d86123 : 如果沒有現在的AI演進,未來怎麼可能會有AGI 06/16 22:39
56F:→ d86123 : 即便現在不是也要做 06/16 22:39
57F:→ xluds24805 : 5 年前的 AI 的確是這樣,但現在已經是 2025 年了.. 06/16 22:52
58F:→ xluds24805 : . 06/16 22:52
59F:→ xluds24805 : 這篇論文是寫了多久才寫出來? 06/16 22:52
60F:推 GTR34 : ? 不然捏 能通過圖靈測試早就拿出來吹啦 06/16 23:03
61F:噓 ssshleo : 班上功課倒數的同學在教前三名唸書 06/16 23:05
62F:推 tommy449 : 怎麼說都合理? 06/16 23:11
63F:→ widec : GPT 4.5早就通過圖靈測試了啊 06/17 08:26
64F:噓 ian41360 : 喔喔你的AI甚麼時候出來? 06/17 08:51
65F:噓 rz759 : 先做出來再說 06/17 10:26
66F:噓 dakkk : ai就是工具 要思考什麼 06/17 10:52
67F:噓 n7555235 : 哇靠,AI會思考,那第一個換掉的一定是那個廚師 06/17 16:04
68F:推 kimmj : AI不是噱頭,但現階段的AI確實不具自主思考能力, 06/17 16:48
69F:→ kimmj : 尚稱不上人工生命 06/17 16:48
70F:→ eemail : 現在一直在講算力提高其實就是證明另一件事 自己想 06/17 20:21
71F:→ eemail : 不告訴你@@ 06/17 20:21
72F:推 ffaatt : 現在主流不能思考 都屌打siri 06/17 22:12
73F:推 seemoon2000 : 就講一個簡單的事實 多數人的思考很久的答案 都不 06/18 10:21
74F:→ seemoon2000 : 如AI不思考直接給的答案 他訓練的知識就比人多 06/18 10:21
75F:→ nrsair : AI 06/18 10:49
76F:→ Gundam77 : 打不贏只好....大家都是垃圾,不要分那麼細。 06/18 12:39
77F:推 cplusplus426: 蘋果484只剩嘴 06/18 20:43
78F:→ fjucharlie : 應該說你請了多少印度工程師 06/19 14:40
79F:推 sadsumo : 目前的AI都是抄襲未來的蘋果 06/21 03:39







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:WOW站內搜尋

TOP