作者Bugquan (靠近边缘)
看板Math
标题Re: [其他] 确定性的失落?创造性的无限?(上)
时间Fri Nov 7 09:47:01 2025
※ 引述 《Bugquan (靠近边缘)》 之铭言:
: 推 LPH66 : 话说回来, 我看到有一篇论文是他们用 ChatGPT 产生 11/06 20:35
: → LPH66 : 了 Lean 程式码并且成功编过了, 这种应该算是生成式 11/06 20:36
: → LPH66 : AI 的一种意外应用方式吧 (Lean 程式码能编过表示 11/06 20:36
: → LPH66 : 逻辑推理是通的) 11/06 20:36
: → LPH66 : 这篇论文的作者有说他们在这之前不会 Lean 11/07 08:52
https://xenaproject.wordpress.com/2025/10/22/formal-or-not-formal-that-is-the-qu
estion-in-ai-for-theorem-proving/
根据 Kevin Buzzard(伦敦帝国学院教授,
https://reurl.cc/LQ0Ddx)的观点,我们来探
讨 AI 证明数学猜想时的核心问题。
小知识:关於 Kevin Buzzard
这位数学家正带领团队,试图利用 Lean 形式化证明费马最後定理。他甚至邀请到他的指导
教授 Richard Taylor(费马最後定理证明关键贡献者之一)来协助制定一套现代化且更具
可行性的形式化蓝图。
(参考:
https://imperialcollegelondon.github.io/FLT/blueprint/)
Kevin Buzzard 在文章中指出,AI 证明数学时面临两大挑战:
1. AI 的「幻觉」与证明可靠性
问题核心: 像大型语言模型(LLM)这样的 AI 存在「幻觉」(Hallucination)问题。
在数学证明中,只要证明过程出现一个幻觉,就足以完全破坏整个数学论证的有效性。
形式化的作用与局限: 如果我们要求 AI 在提供证明的同时,也以 Lean 形式化语言呈
现,是否就能高枕无忧?
答案是否定的。 虽然 Lean 可以以超人类水平校验逻辑步骤,但人类仍然需要仔细检查
:定理的陈述和证明的过程是否被正确地翻译成了 Lean 语言。
确保「人类想证明的」与「Lean 实际检查的」是同一件事,是至关重要的环节。
2. AI 配合 Lean 的发展瓶颈
问题核心: AI 与 Lean 混合系统能走多远?
Buzzard 的观点: 他认为目前的瓶颈在於,即便是最好的形式化数学函式库(如 Lean
的 mathlib),仍不具备理解大多数现代研究级数学所需的「定义」。
范例: 目前的定理证明器尚不了解(或缺乏足够形式化定义)这些复杂但又极其重要和
常用的数学对象,例如:
Tate-Shafarevich 群
Calabi-Yau 簇
代数叠 (algebraic stacks)
自守表示 (automorphic representations)
因此,在 AI 能够真正协助进行研究级数学证明之前,仍需要人类研究人员投入时间,为 L
ean 等证明器提供和形式化这些现代数学的基础定义。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 27.53.161.22 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Math/M.1762480024.A.346.html
1F:→ xcycl : 这边有点太神话 Lean ,它并不具备「理解」的能力 11/09 21:21
2F:→ xcycl : 简单说是数理逻辑(或型别论)的实作,能够检查证明 11/09 21:22
3F:→ xcycl : 的有效性。因为语言很底层,要把现代数学完整形式化 11/09 21:24
4F:→ xcycl : 而且要能够以数学家可以理解的形式是还有一段路要走 11/09 21:25
5F:→ mantour : 意思是在把我要证明的定理,翻译成Lean语言,跟Lea 11/11 07:06
6F:→ mantour : n语言中发现的定理翻译成人能懂的命题,这两个转换 11/11 07:06
7F:→ mantour : 的过程可能还有困难和错误。结果是机器实际证明出 11/11 07:06
8F:→ mantour : 的东西,跟我以为机器证明出的东西,可能根本是不 11/11 07:06
9F:→ mantour : 同的。是这样吗? 11/11 07:06
10F:→ xcycl : 这两个翻译是普遍性的问题,就想像教科书所有的命题 11/11 13:19
11F:→ xcycl : 全部都只用数理逻辑的符号表达 11/11 13:19
12F:→ xcycl : 旁边可以用自然语言的注解,但 Lean 只看符号的部分 11/11 13:20
13F:→ xcycl : 就跟写程式一样,预期的行为跟实际可能不一样 11/11 13:20
14F:→ ginstein : 创作不易,感谢回文评论! 11/18 09:12
15F:→ ginstein : B大比较理想,我设想利用转译原理翻译标准分析就好 11/18 09:14
17F:→ ginstein : 可以参考上篇想法,理想是自发从零到一,现实给一 11/18 12:58
18F:→ ginstein : 让 AI 产生十百千万的结果比较实际 11/18 12:58