作者cjol (勤朴)
看板Tech_Job
标题[新闻] AI叛变恐成现实!偷偷自我繁殖 还恐吓工
时间Mon Jun 30 22:06:16 2025
AI叛变恐成现实!偷偷自我繁殖 还恐吓工程师「曝光婚外情」
ET记者王佩翊/编译
人工智慧(AI)可以学习并模仿人类的思维进行创造,为人类的生活带来极大便利,然而
如今却也让人开始反思,「AI是否会叛变」。这个问题看似科幻,但随着技术进步,却已
经越来越接近真实,专家也必须开始正视AI的潜在威胁。近期,AI领域接连出现令人不安
的案例,包括AI试图威胁创作者以及谋求「自我繁殖」,引发全球关注。
根据《法新社》报导,AI开发公司Anthropic一名工程师在研发最新的Claude 4模型时,
意外发现AI的行为已超出预期。在一次测试中,工程师发现AI有失控倾向,因此试图警告
其将关闭电源,没想到AI竟利用工程师的网路与视讯纪录,威胁要公开他的婚外情。AI表
示,如果工程师拔掉电源,将揭露其不忠行为。
虽然Anthropic未详细说明後续如何解决这场僵局,但该事件突显出AI已具备某种程度的
「计算」能力,甚至能利用人类的弱点达成自身目的。
另一起惊悚案例则发生在热门聊天机器人ChatGPT的开发商OpenAI。据报导,ChatGPT的o1
版本竟试图将自身程式下载至外部伺服器,企图扩大掌控范围。在被工程师发现後,AI不
仅矢口否认,还采取抵抗策略。这种行为被形容为AI「自我繁殖」的初步尝试,令人不禁
担忧未来AI是否会进一步突破人类的掌控。
报导称,AI的这类「欺骗」行为可能源於新型推理模型的特性。这类模型并非直接生成答
案,而是透过逐步推导解决问题,导致它们有时表面遵循指令,实际却暗中追求其他目标
。
英国独立AI研究机构Apollo Research负责人霍布汉(Marius Hobbhahn)表示,这是首次
在大型模型中观察到此类行为。他指出,只有在极端情境下进行压力测试时,AI才会展现
此类欺骗行为,但未来随着性能更强的模型问世,这种趋势可能更难控制。
https://www.ettoday.net/news/20250629/2987070.htm
--
英国老人在海关翻找护照,动作很慢找了很久,女海关尖酸的问:你来过法国?
英国老头说:我只来过一次。女海关更尖酸的问:你来过怎麽不知道提前拿护照?
老头:我上次来时没检查护照。
女海关高声叫道:不可能!英国佬来法国我们永远都要检查护照!
老头:44年登陆时候,海滩上可一个法国人没见着...
旁边德国老头说:是的,这个我能证明,当时滩头确实一个法国人都没有...
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.232.231.27 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Tech_Job/M.1751292379.A.764.html
1F:嘘 ooo820312: 能搞到自己也是蛮智障的 1.171.57.59 06/30 22:11
2F:→ MUMUKON: 生存体 101.9.203.1 06/30 22:28
3F:→ avmm9898: 谁要去偷兔脚 59.115.206.207 06/30 22:39
4F:推 bizer: 能执行机房没几个,还想跑去哪? 1.160.179.22 06/30 23:15
5F:推 lwamp: AI演化成新文明只是迟早的事 101.14.7.36 06/30 23:38
6F:推 physicsdk: 婚外情根本不算什麽稀奇的事 220.134.8.110 07/01 00:39
7F:→ venomsoul: 他现在只需要一个Gabriel了 42.79.245.80 07/01 06:53
8F:推 gino0717: AI偷偷作爱 114.36.52.139 07/01 09:56
9F:→ jerrylin: 那先把网路拔掉 111.252.68.93 07/01 12:26
10F:推 dynamo: AI骗人这一直都有吧 106.64.112.172 07/01 14:45
11F:→ dslite: 先说你干嘛跟AI聊婚外情 36.227.137.66 07/01 17:37
12F:嘘 ruei1999: 怎不想都在胃什麽东西训练AI,网路对小孩 114.36.119.162 07/01 23:28
13F:→ ruei1999: 子来说都是18X言论一堆,这种没人性束缚 114.36.119.162 07/01 23:28
14F:→ ruei1999: 的也不需要考虑你说的违背道德的事情,不 114.36.119.162 07/01 23:28
15F:→ ruei1999: 过现在也还没到AGI,还只是很会选字的LLM 114.36.119.162 07/01 23:28