作者Kai877 (金炆炡的狗)
看板MobileComm
标题Fw: [心得] 苹果揭露人工智能并不思考
时间Mon Jun 16 12:48:36 2025
※ [本文转录自 Stock 看板 #1eJk0_y9 ]
作者: huabandd (我是阿肥巴你头) 看板: Stock
标题: [心得] 苹果揭露人工智能并不思考
时间: Sun Jun 15 23:01:12 2025
https://is.gd/U7lWC8
看到一个影片,非新闻报导,仅创作者想法
讨论苹果揭露关於人工智能当中的最大谎言
之前也看过一个影片指出
AI无法产出指针在10:10以外的手表
(网路手表图片通常指针停留在10:10)
自己尝试过几次确实是这样
因为AI的训练是基於现有大量资料
去产生一个与大量资料相似的产物给你
无法产生未曾有过资料的产物
(以上为个人猜测,若错误请指正)
虽然现在已有研究尝试将AI接入人类神经元
未来思考的方式有可能因此改变
不再只是记忆,而是真正的推理
(但是这好像也是一件满恐怖的事情?)
如果说给AI一个围棋组,但不教他玩法
也不让他参考棋类玩法,让他自行摸索
就像婴儿拿到玩具後自己乱玩那样
AI能够自行生成玩法是不是就算是成功?
中文翻译
苹果刚刚揭露了人工智慧中最大的谎言,即「思考」的假象,证明了像 Claude、Deepseek-
R1 和 OpenAI 的 o3-mini 等推理模型实际上并不会思考。苹果没有重复使用旧有的数学问
题,而是创造了这些模型从未见过全新谜题。结果令人震惊。
对於简单问题,标准 AI 模型表现优於昂贵的推理模型,同时消耗更少的资源。对於中等复
杂度问题,推理模型显示出一些优势,但对於模拟现实世界情境的高复杂度问题,两种类型
的模型都崩溃到 0% 的准确度。
这是确凿的证据:苹果给予 AI 模型逐步的演算法,就像给某人食谱一样,但它们仍在相同
的门槛下失败了。这证明它们无法遵循逻辑指令。该研究没有发现任何形式推理的证据,得
出结论认为其行为最好用复杂的模式匹配来解释。
简单地更改名称和问题会显着降低性能。苹果测试了河内塔(Tower of Hanoi)谜题,模型
在超过 100 步的移动中成功了,但在新颖的渡河谜题中仅仅 4 步後就失败了。它们是记忆
模式,而不是进行逻辑推理。
随着问题变得越来越难,「思考」模型使用的 token 越来越少,放弃得更快,而不是更深
入地思考。即使无限的计算资源也无济於事。这揭示了数十亿美元的 AI 投资是建立在错误
前提上的。
公司将复杂的模式匹配宣传为真正的推理,误导消费者对 AI 能力的认知。我们离通用人工
智慧(AGI)的距离并没有大家想像的那麽近;我们正在处理的是非常复杂的自动完成系统
。当先进的 AI 推理模型连遵循简单指令都失败时,我们是否正生活在一个建立在幻想之上
的 AI 炒作泡沫中?
英文原文
Apple just exposed the biggest lie in AI with the illusion of "thinking," provin
g that reasoning models like Claude, Deepseek-R1, and OpenAI's o3-mini don't act
ually think. Instead of recycling math problems, Apple created brand new puzzles
these models had never seen. The results were shocking.
For simple problems, standard AI models outperformed expensive reasoning models
while using fewer resources. For medium complexity, reasoning models showed some
advantage, but for high complexity problems that mirror real-world scenarios, b
oth types collapsed to 0% accuracy.
Here's the damning evidence: Apple gave AI models step-by-step algorithms, like
giving someone a recipe, and they still failed at the same thresholds. This prov
es they can't follow logical instructions. The study found no evidence of formal
reasoning, concluding behavior is better explained by sophisticated pattern mat
ching.
Simply changing names and problems degraded performance dramatically. Apple test
ed Tower of Hanoi puzzles, where models succeeded with 100-plus moves but failed
at novel river crossing puzzles after just 4 moves. They memorized patterns rat
her than reasoned logically.
As problems got harder, "thinking" models used fewer tokens and gave up faster i
nstead of thinking deeper. Even unlimited computational resources couldn't help.
This exposes that billions in AI investment are based on false premises.
Companies market sophisticated pattern matching as genuine reasoning, misleading
consumers about AI capabilities. We are not as close to AGI as everyone thinks;
we're dealing with very sophisticated autocomplete systems. When advanced AI re
asoning models fail at following simple instructions, are we living in an AI hyp
e bubble built on illusions?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
※ 转录者: Kai877 (27.240.233.101 台湾), 06/16/2025 12:48:36
※ 编辑: Kai877 (27.240.233.101 台湾), 06/16/2025 12:49:23
1F:推 barkids : 做不出来,先打预防针:都是假的!AI其实没那麽好 06/16 12:55
2F:→ barkids : 苹果才是先知,哈哈哈 XXD 06/16 12:57
3F:推 answer012103: 不是我们不做 是我们不做烂东西 06/16 13:17
4F:推 s213092921 : NOKIApple 06/16 13:30
5F:→ a27588679 : 看来苹果打算推出真正会思考的ai一举超越其他竞品? 06/16 13:35
6F:推 keineAhnung : 原来是人工智能 我还以为是苹果用户 06/16 13:39
7F:推 ncuephysics : 重新定义 06/16 13:40
8F:推 foolwind : 官方认证AI没用 果又赢 06/16 13:41
9F:→ JuiFu617 : 不会思考就这麽强,会思考还得了 06/16 13:43
10F:→ JuiFu617 : 作为工具,我宁愿他永远不会思考 06/16 13:46
12F:→ nekoares : 应该说你怎麽定义思考 06/16 13:54
13F:嘘 astrofluket6: 能智 06/16 14:05
14F:→ square4 : 抖音影片把苹果研究反着写也真是厉害,还是看正经 06/16 14:10
16F:推 tetani : ai只是统计学的大数据应用而已 06/16 14:12
17F:推 Wardyal : 这不是早就知道的事情吗 06/16 14:25
18F:推 tktk1212 : 会思考感觉很可怕 现在这样就可以了 06/16 14:29
19F:→ widec : 苹果是说AI没「推理」不是思考吧 06/16 14:30
20F:→ widec : 然後这篇论文不是被打脸乱写了吗 06/16 14:31
21F:嘘 MisterSmile : 你那边做空美元还来得及 06/16 14:31
22F:→ widec : AI这麽笨不会推理却可以解开一些人类解不开的数学? 06/16 14:32
23F:→ widec : 用大腿想都知道这篇结论很奇怪 06/16 14:33
24F:嘘 cstease64 : 这篇早就被打脸了 老哥 06/16 14:36
26F:→ Crios : 苹果说的都是对的 不可质疑 没错~ 06/16 15:11
27F:推 graphict : 本来就是,AI就是噱头居多 06/16 15:20
28F:推 maninpink : 现在这年头居然还有人认为AI是噱头... 06/16 15:29
29F:推 doom3 : AI发新版本比手机出新机还快 现在没有不代表未来没 06/16 15:42
30F:→ manbow77 : 目前虽然还是深度学习大数据 但潜在应用已经非常广 06/16 15:45
31F:→ eric78659 : 现在生成式AI一直都是旧有资料去生啊,生不出新东西 06/16 16:10
32F:推 wujet09100 : 苹果玩文字接龙玩书其他公司 然後乾脆直接说其他公 06/16 16:12
33F:→ wujet09100 : 司发展方向都错了 嘻嘻 06/16 16:12
34F:推 j0958322080 : 重新定义 AI 06/16 17:12
35F:嘘 piyopiyolee : 你拨接欧!Nvidia都发一篇打脸了 06/16 17:23
36F:嘘 basacola : 这谁不知道 06/16 17:55
37F:推 ww : 就跟某些念过很多书 说的头头是道的人一样 遇见没 06/16 17:58
38F:→ ww : 看过的问题就傻了 06/16 17:58
39F:推 aasssdddd : ai可以写大家都看的懂的搜死扣 听起来不是很棒吗 06/16 18:11
40F:→ alan3100 : 可怜 没创新被创新打趴 还在那鸡蛋挑骨头XD 06/16 18:19
41F:推 teasy : 那去年狂打AI 的iPhone 不就是唬烂的 06/16 18:30
42F:推 issemn : 原来是说人工智能 我还以为是说果粉 06/16 19:15
43F:推 aotom : 这不就废话吗?离AGI当然还有一段距离 06/16 19:30
44F:→ xixixxiixxii: 叫ai做事要给精确指令 06/16 19:31
45F:推 f396761440 : 一家手机厂的文章搞得很像报纸的社论文 06/16 19:35
46F:→ f396761440 : 在检讨其他公司的AI技术时, 而自己却搞不出来 06/16 19:35
47F:嘘 markmao : 通篇废话 AGI本来就刚起步 不用水果揭露 更不需要一 06/16 19:44
48F:→ markmao : 个来路不明的人自以为戳破泡泡 06/16 19:44
49F:→ Numenor : AI发展已经走歪了大量的运算都浪费在干话瞎掰上, 06/16 21:47
50F:→ Numenor : 泡泡不戳破只会走的更歪 06/16 21:47
51F:→ moon999tw : 阿婆 加油 好吗 06/16 21:48
52F:推 aikolove : 就你最没资格嘴 06/16 21:53
53F:→ A5Watamate : 但是人类的思考也是从自己知识中寻找最佳解答啊… 06/16 22:09
54F:嘘 DALLEN : 所以AI SIRI做完没? 06/16 22:22
55F:→ d86123 : 如果没有现在的AI演进,未来怎麽可能会有AGI 06/16 22:39
56F:→ d86123 : 即便现在不是也要做 06/16 22:39
57F:→ xluds24805 : 5 年前的 AI 的确是这样,但现在已经是 2025 年了.. 06/16 22:52
58F:→ xluds24805 : . 06/16 22:52
59F:→ xluds24805 : 这篇论文是写了多久才写出来? 06/16 22:52
60F:推 GTR34 : ? 不然捏 能通过图灵测试早就拿出来吹啦 06/16 23:03
61F:嘘 ssshleo : 班上功课倒数的同学在教前三名念书 06/16 23:05
62F:推 tommy449 : 怎麽说都合理? 06/16 23:11
63F:→ widec : GPT 4.5早就通过图灵测试了啊 06/17 08:26
64F:嘘 ian41360 : 喔喔你的AI甚麽时候出来? 06/17 08:51
65F:嘘 rz759 : 先做出来再说 06/17 10:26
66F:嘘 dakkk : ai就是工具 要思考什麽 06/17 10:52
67F:嘘 n7555235 : 哇靠,AI会思考,那第一个换掉的一定是那个厨师 06/17 16:04
68F:推 kimmj : AI不是噱头,但现阶段的AI确实不具自主思考能力, 06/17 16:48
69F:→ kimmj : 尚称不上人工生命 06/17 16:48
70F:→ eemail : 现在一直在讲算力提高其实就是证明另一件事 自己想 06/17 20:21
71F:→ eemail : 不告诉你@@ 06/17 20:21
72F:推 ffaatt : 现在主流不能思考 都屌打siri 06/17 22:12
73F:推 seemoon2000 : 就讲一个简单的事实 多数人的思考很久的答案 都不 06/18 10:21
74F:→ seemoon2000 : 如AI不思考直接给的答案 他训练的知识就比人多 06/18 10:21
75F:→ nrsair : AI 06/18 10:49
76F:→ Gundam77 : 打不赢只好....大家都是垃圾,不要分那麽细。 06/18 12:39
77F:推 cplusplus426: 苹果484只剩嘴 06/18 20:43
78F:→ fjucharlie : 应该说你请了多少印度工程师 06/19 14:40
79F:推 sadsumo : 目前的AI都是抄袭未来的苹果 06/21 03:39