作者Kai877 (金炆炡的狗)

看板MobileComm

标题

Fw: [心得] 苹果揭露人工智能并不思考

时间Mon Jun 16 12:48:36 2025

※ [本文转录自 Stock 看板 #1eJk0_y9 ] 作者: huabandd (我是阿肥巴你头) 看板: Stock 标题: [心得] 苹果揭露人工智能并不思考时间: Sun Jun 15 23:01:12 2025 https://is.gd/U7lWC8 看到一个影片，非新闻报导，仅创作者想法讨论苹果揭露关於人工智能当中的最大谎言之前也看过一个影片指出 AI无法产出指针在10:10以外的手表（网路手表图片通常指针停留在10:10）自己尝试过几次确实是这样因为AI的训练是基於现有大量资料去产生一个与大量资料相似的产物给你无法产生未曾有过资料的产物（以上为个人猜测，若错误请指正）虽然现在已有研究尝试将AI接入人类神经元未来思考的方式有可能因此改变不再只是记忆，而是真正的推理（但是这好像也是一件满恐怖的事情？）如果说给AI一个围棋组，但不教他玩法也不让他参考棋类玩法，让他自行摸索就像婴儿拿到玩具後自己乱玩那样 AI能够自行生成玩法是不是就算是成功？中文翻译苹果刚刚揭露了人工智慧中最大的谎言，即「思考」的假象，证明了像 Claude、Deepseek- R1 和 OpenAI 的 o3-mini 等推理模型实际上并不会思考。苹果没有重复使用旧有的数学问题，而是创造了这些模型从未见过全新谜题。结果令人震惊。对於简单问题，标准 AI 模型表现优於昂贵的推理模型，同时消耗更少的资源。对於中等复杂度问题，推理模型显示出一些优势，但对於模拟现实世界情境的高复杂度问题，两种类型的模型都崩溃到 0% 的准确度。这是确凿的证据：苹果给予 AI 模型逐步的演算法，就像给某人食谱一样，但它们仍在相同的门槛下失败了。这证明它们无法遵循逻辑指令。该研究没有发现任何形式推理的证据，得出结论认为其行为最好用复杂的模式匹配来解释。简单地更改名称和问题会显着降低性能。苹果测试了河内塔（Tower of Hanoi）谜题，模型在超过 100 步的移动中成功了，但在新颖的渡河谜题中仅仅 4 步後就失败了。它们是记忆模式，而不是进行逻辑推理。随着问题变得越来越难，「思考」模型使用的 token 越来越少，放弃得更快，而不是更深入地思考。即使无限的计算资源也无济於事。这揭示了数十亿美元的 AI 投资是建立在错误前提上的。公司将复杂的模式匹配宣传为真正的推理，误导消费者对 AI 能力的认知。我们离通用人工智慧（AGI）的距离并没有大家想像的那麽近；我们正在处理的是非常复杂的自动完成系统。当先进的 AI 推理模型连遵循简单指令都失败时，我们是否正生活在一个建立在幻想之上的 AI 炒作泡沫中？英文原文 Apple just exposed the biggest lie in AI with the illusion of "thinking," provin g that reasoning models like Claude, Deepseek-R1, and OpenAI's o3-mini don't act ually think. Instead of recycling math problems, Apple created brand new puzzles these models had never seen. The results were shocking. For simple problems, standard AI models outperformed expensive reasoning models while using fewer resources. For medium complexity, reasoning models showed some advantage, but for high complexity problems that mirror real-world scenarios, b oth types collapsed to 0% accuracy. Here's the damning evidence: Apple gave AI models step-by-step algorithms, like giving someone a recipe, and they still failed at the same thresholds. This prov es they can't follow logical instructions. The study found no evidence of formal reasoning, concluding behavior is better explained by sophisticated pattern mat ching. Simply changing names and problems degraded performance dramatically. Apple test ed Tower of Hanoi puzzles, where models succeeded with 100-plus moves but failed at novel river crossing puzzles after just 4 moves. They memorized patterns rat her than reasoned logically. As problems got harder, "thinking" models used fewer tokens and gave up faster i nstead of thinking deeper. Even unlimited computational resources couldn't help. This exposes that billions in AI investment are based on false premises. Companies market sophisticated pattern matching as genuine reasoning, misleading consumers about AI capabilities. We are not as close to AGI as everyone thinks; we're dealing with very sophisticated autocomplete systems. When advanced AI re asoning models fail at following simple instructions, are we living in an AI hyp e bubble built on illusions? --

※ 发信站: 批踢踢实业坊(ptt.cc) ※ 转录者: Kai877 (27.240.233.101 台湾), 06/16/2025 12:48:36 ※ 编辑: Kai877 (27.240.233.101 台湾), 06/16/2025 12:49:23

1^F：推 barkids : 做不出来，先打预防针：都是假的！AI其实没那麽好 06/16 12:55

2^F：→ barkids : 苹果才是先知，哈哈哈 XXD 06/16 12:57

3^F：推 answer012103: 不是我们不做是我们不做烂东西 06/16 13:17

4^F：推 s213092921 : NOKIApple 06/16 13:30

5^F：→ a27588679 : 看来苹果打算推出真正会思考的ai一举超越其他竞品？ 06/16 13:35

6^F：推 keineAhnung : 原来是人工智能我还以为是苹果用户 06/16 13:39

7^F：推 ncuephysics : 重新定义 06/16 13:40

8^F：推 foolwind : 官方认证AI没用果又赢 06/16 13:41

9^F：→ JuiFu617 : 不会思考就这麽强，会思考还得了 06/16 13:43

10^F：→ JuiFu617 : 作为工具，我宁愿他永远不会思考 06/16 13:46

11^F：→ JuiFu617 : https://i.imgur.com/YxJUPJb.jpeg 06/16 13:48

12^F：→ nekoares : 应该说你怎麽定义思考 06/16 13:54

13^F：嘘 astrofluket6: 能智 06/16 14:05

14^F：→ square4 : 抖音影片把苹果研究反着写也真是厉害，还是看正经 06/16 14:10

15^F：→ square4 : 报导吧https://reurl.cc/XAzdb3 06/16 14:10

16^F：推 tetani : ai只是统计学的大数据应用而已 06/16 14:12

17^F：推 Wardyal : 这不是早就知道的事情吗 06/16 14:25

18^F：推 tktk1212 : 会思考感觉很可怕现在这样就可以了 06/16 14:29

19^F：→ widec : 苹果是说AI没「推理」不是思考吧 06/16 14:30

20^F：→ widec : 然後这篇论文不是被打脸乱写了吗 06/16 14:31

21^F：嘘 MisterSmile : 你那边做空美元还来得及 06/16 14:31

22^F：→ widec : AI这麽笨不会推理却可以解开一些人类解不开的数学？ 06/16 14:32

23^F：→ widec : 用大腿想都知道这篇结论很奇怪 06/16 14:33

24^F：嘘 cstease64 : 这篇早就被打脸了老哥 06/16 14:36

25^F：→ JuiFu617 : https://i.imgur.com/OLhqxZF.jpeg 06/16 15:04

26^F：→ Crios : 苹果说的都是对的不可质疑没错~ 06/16 15:11

27^F：推 graphict : 本来就是，AI就是噱头居多 06/16 15:20

28^F：推 maninpink : 现在这年头居然还有人认为AI是噱头... 06/16 15:29

29^F：推 doom3 : AI发新版本比手机出新机还快现在没有不代表未来没 06/16 15:42

30^F：→ manbow77 : 目前虽然还是深度学习大数据但潜在应用已经非常广 06/16 15:45

31^F：→ eric78659 : 现在生成式AI一直都是旧有资料去生啊，生不出新东西 06/16 16:10

32^F：推 wujet09100 : 苹果玩文字接龙玩书其他公司然後乾脆直接说其他公 06/16 16:12

33^F：→ wujet09100 : 司发展方向都错了嘻嘻 06/16 16:12

34^F：推 j0958322080 : 重新定义 AI 06/16 17:12

35^F：嘘 piyopiyolee : 你拨接欧！Nvidia都发一篇打脸了 06/16 17:23

36^F：嘘 basacola : 这谁不知道 06/16 17:55

37^F：推 ww : 就跟某些念过很多书说的头头是道的人一样遇见没 06/16 17:58

38^F：→ ww : 看过的问题就傻了 06/16 17:58

39^F：推 aasssdddd : ai可以写大家都看的懂的搜死扣听起来不是很棒吗 06/16 18:11

40^F：→ alan3100 : 可怜没创新被创新打趴还在那鸡蛋挑骨头XD 06/16 18:19

41^F：推 teasy : 那去年狂打AI 的iPhone 不就是唬烂的 06/16 18:30

42^F：推 issemn : 原来是说人工智能我还以为是说果粉 06/16 19:15

43^F：推 aotom : 这不就废话吗？离AGI当然还有一段距离 06/16 19:30

44^F：→ xixixxiixxii: 叫ai做事要给精确指令 06/16 19:31

45^F：推 f396761440 : 一家手机厂的文章搞得很像报纸的社论文 06/16 19:35

46^F：→ f396761440 : 在检讨其他公司的AI技术时, 而自己却搞不出来 06/16 19:35

47^F：嘘 markmao : 通篇废话 AGI本来就刚起步不用水果揭露更不需要一 06/16 19:44

48^F：→ markmao : 个来路不明的人自以为戳破泡泡 06/16 19:44

49^F：→ Numenor : AI发展已经走歪了大量的运算都浪费在干话瞎掰上， 06/16 21:47

50^F：→ Numenor : 泡泡不戳破只会走的更歪 06/16 21:47

51^F：→ moon999tw : 阿婆加油好吗 06/16 21:48

52^F：推 aikolove : 就你最没资格嘴 06/16 21:53

53^F：→ A5Watamate : 但是人类的思考也是从自己知识中寻找最佳解答啊… 06/16 22:09

54^F：嘘 DALLEN : 所以AI SIRI做完没? 06/16 22:22

55^F：→ d86123 : 如果没有现在的AI演进，未来怎麽可能会有AGI 06/16 22:39

56^F：→ d86123 : 即便现在不是也要做 06/16 22:39

57^F：→ xluds24805 : 5 年前的 AI 的确是这样，但现在已经是 2025 年了.. 06/16 22:52

58^F：→ xluds24805 : . 06/16 22:52

59^F：→ xluds24805 : 这篇论文是写了多久才写出来？ 06/16 22:52

60^F：推 GTR34 : ? 不然捏能通过图灵测试早就拿出来吹啦 06/16 23:03

61^F：嘘 ssshleo : 班上功课倒数的同学在教前三名念书 06/16 23:05

62^F：推 tommy449 : 怎麽说都合理？ 06/16 23:11

63^F：→ widec : GPT 4.5早就通过图灵测试了啊 06/17 08:26

64^F：嘘 ian41360 : 喔喔你的AI甚麽时候出来？ 06/17 08:51

65^F：嘘 rz759 : 先做出来再说 06/17 10:26

66^F：嘘 dakkk : ai就是工具要思考什麽 06/17 10:52

67^F：嘘 n7555235 : 哇靠，AI会思考，那第一个换掉的一定是那个厨师 06/17 16:04

68^F：推 kimmj : AI不是噱头，但现阶段的AI确实不具自主思考能力， 06/17 16:48

69^F：→ kimmj : 尚称不上人工生命 06/17 16:48

70^F：→ eemail : 现在一直在讲算力提高其实就是证明另一件事自己想 06/17 20:21

71^F：→ eemail : 不告诉你@@ 06/17 20:21

72^F：推 ffaatt : 现在主流不能思考都屌打siri 06/17 22:12

73^F：推 seemoon2000 : 就讲一个简单的事实多数人的思考很久的答案都不 06/18 10:21

74^F：→ seemoon2000 : 如AI不思考直接给的答案他训练的知识就比人多 06/18 10:21

75^F：→ nrsair : AI 06/18 10:49

76^F：→ Gundam77 : 打不赢只好....大家都是垃圾，不要分那麽细。 06/18 12:39

77^F：推 cplusplus426: 苹果484只剩嘴 06/18 20:43

78^F：→ fjucharlie : 应该说你请了多少印度工程师 06/19 14:40

79^F：推 sadsumo : 目前的AI都是抄袭未来的苹果 06/21 03:39

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

MobileComm 板

Fw: [心得] 苹果揭露人工智能并不思考

热门看板

赞助商连结