Math 板


LINE

※ 引述 《Bugquan (靠近边缘)》 之铭言: : 推 LPH66 : 话说回来, 我看到有一篇论文是他们用 ChatGPT 产生 11/06 20:35 : → LPH66 : 了 Lean 程式码并且成功编过了, 这种应该算是生成式 11/06 20:36 : → LPH66 : AI 的一种意外应用方式吧 (Lean 程式码能编过表示 11/06 20:36 : → LPH66 : 逻辑推理是通的) 11/06 20:36 : → LPH66 : 这篇论文的作者有说他们在这之前不会 Lean 11/07 08:52 https://xenaproject.wordpress.com/2025/10/22/formal-or-not-formal-that-is-the-qu estion-in-ai-for-theorem-proving/ 根据 Kevin Buzzard(伦敦帝国学院教授,https://reurl.cc/LQ0Ddx)的观点,我们来探 讨 AI 证明数学猜想时的核心问题。 小知识:关於 Kevin Buzzard 这位数学家正带领团队,试图利用 Lean 形式化证明费马最後定理。他甚至邀请到他的指导 教授 Richard Taylor(费马最後定理证明关键贡献者之一)来协助制定一套现代化且更具 可行性的形式化蓝图。 (参考:https://imperialcollegelondon.github.io/FLT/blueprint/) Kevin Buzzard 在文章中指出,AI 证明数学时面临两大挑战: 1. AI 的「幻觉」与证明可靠性 问题核心: 像大型语言模型(LLM)这样的 AI 存在「幻觉」(Hallucination)问题。 在数学证明中,只要证明过程出现一个幻觉,就足以完全破坏整个数学论证的有效性。 形式化的作用与局限: 如果我们要求 AI 在提供证明的同时,也以 Lean 形式化语言呈 现,是否就能高枕无忧? 答案是否定的。 虽然 Lean 可以以超人类水平校验逻辑步骤,但人类仍然需要仔细检查 :定理的陈述和证明的过程是否被正确地翻译成了 Lean 语言。 确保「人类想证明的」与「Lean 实际检查的」是同一件事,是至关重要的环节。 2. AI 配合 Lean 的发展瓶颈 问题核心: AI 与 Lean 混合系统能走多远? Buzzard 的观点: 他认为目前的瓶颈在於,即便是最好的形式化数学函式库(如 Lean 的 mathlib),仍不具备理解大多数现代研究级数学所需的「定义」。 范例: 目前的定理证明器尚不了解(或缺乏足够形式化定义)这些复杂但又极其重要和 常用的数学对象,例如: Tate-Shafarevich 群 Calabi-Yau 簇 代数叠 (algebraic stacks) 自守表示 (automorphic representations) 因此,在 AI 能够真正协助进行研究级数学证明之前,仍需要人类研究人员投入时间,为 L ean 等证明器提供和形式化这些现代数学的基础定义。 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 27.53.161.22 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Math/M.1762480024.A.346.html
1F:→ xcycl : 这边有点太神话 Lean ,它并不具备「理解」的能力 11/09 21:21
2F:→ xcycl : 简单说是数理逻辑(或型别论)的实作,能够检查证明 11/09 21:22
3F:→ xcycl : 的有效性。因为语言很底层,要把现代数学完整形式化 11/09 21:24
4F:→ xcycl : 而且要能够以数学家可以理解的形式是还有一段路要走 11/09 21:25
5F:→ mantour : 意思是在把我要证明的定理,翻译成Lean语言,跟Lea 11/11 07:06
6F:→ mantour : n语言中发现的定理翻译成人能懂的命题,这两个转换 11/11 07:06
7F:→ mantour : 的过程可能还有困难和错误。结果是机器实际证明出 11/11 07:06
8F:→ mantour : 的东西,跟我以为机器证明出的东西,可能根本是不 11/11 07:06
9F:→ mantour : 同的。是这样吗? 11/11 07:06
10F:→ xcycl : 这两个翻译是普遍性的问题,就想像教科书所有的命题 11/11 13:19
11F:→ xcycl : 全部都只用数理逻辑的符号表达 11/11 13:19
12F:→ xcycl : 旁边可以用自然语言的注解,但 Lean 只看符号的部分 11/11 13:20
13F:→ xcycl : 就跟写程式一样,预期的行为跟实际可能不一样 11/11 13:20
14F:→ ginstein : 创作不易,感谢回文评论! 11/18 09:12
15F:→ ginstein : B大比较理想,我设想利用转译原理翻译标准分析就好 11/18 09:14
16F:→ ginstein : https://www.zhihu.com/pin/1966294562063513595 11/18 12:58
17F:→ ginstein : 可以参考上篇想法,理想是自发从零到一,现实给一 11/18 12:58
18F:→ ginstein : 让 AI 产生十百千万的结果比较实际 11/18 12:58







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:BuyTogether站内搜寻

TOP