分页: 1 / 1

#1 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 6月 24日 13:43
牛河梁
联系了一P/NP的老中作者。他前一段时间病了,正在修养中。

目前用ChatGPT和Grok均认可他的P=NP证明是对的。甚至一些作者自己担心的可能问题,这两Ai都不认为有问题。

考虑到ChatGPT和Grok都是作者选的平时用的。可能意见不够中立。万能的买提能否推荐第三个ChatBot用以验证。

要求:

1/ 独立于ChatGPT或Grok训练。特别是不能蒸馏于ChatGPT或Grok。

2/ 向全世界开放使用。最好有免费版。

3/ 能接收理解中文(计算机科学)问题。

#2 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 6月 24日 19:09
magagop
我最近發現Gemini Pro 2.5在數學物理解題方面比ChatGPT好用,至少互補。

#3 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 6月 24日 20:44
tops
DeepSeek Prover + Lean4

#4 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 6月 24日 22:05
WideAnimals

#5 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 6月 25日 00:09
eflame99
这是认真的吗?P=NP了,把比特币都收了吧😂

#6 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 6月 25日 00:25
牛河梁
eflame99 写了: 2025年 6月 25日 00:09 这是认真的吗?P=NP了,把比特币都收了吧😂
那是量子计算?

#7 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 6月 25日 00:29
eflame99
牛河梁 写了: 2025年 6月 25日 00:25 那是量子计算?
P=NP了还要啥量子计算

#8 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 6月 25日 00:47
牛河梁
magagop 写了: 2025年 6月 24日 19:09 我最近發現Gemini Pro 2.5在數學物理解題方面比ChatGPT好用,至少互補。
WideAnimals 写了: 2025年 6月 24日 22:05 试试Llama maverick?
https://www.linkedin.com/pulse/llama-4- ... otal-b4bmc
谢谢。已转达。

BTW:老牛试了一下Gemini (Flash)。Gemini也认为证明了P = NP。有趣的是,Gemini牛逼地给出了改进版证明。理论上,Gemini给的新过程更“实用”。

#9 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 6月 25日 00:49
牛河梁
eflame99 写了: 2025年 6月 25日 00:29 P=NP了还要啥量子计算
O(n)和O(n^2)和O(n^10000000000)都是poly

#10 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 6月 25日 00:53
magagop
牛河梁 写了: 2025年 6月 25日 00:47 谢谢。已转达。

BTW:老牛试了一下Gemini (Flash)。Gemini也认为证明了P = NP。有趣的是,Gemini牛逼地给出了改进版证明。理论上,Gemini给的新过程更“实用”。
我感覺Gemini搞教科書公式推導非常強,可能是谷歌把所有圖書館的書都掃描了,有獨到的訓練集。ChatGPT編程特別厲害,可能是微軟把Github代碼庫分享給OpenAI了。以上全是個人猜測意淫,所以我兩個會員都有,每月$50。

#11 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 6月 25日 01:40
牛河梁
magagop 写了: 2025年 6月 25日 00:53 我感覺Gemini搞教科書公式推導非常強,可能是谷歌把所有圖書館的書都掃描了,有獨到的訓練集。ChatGPT編程特別厲害,可能是微軟把Github代碼庫分享給OpenAI了。以上全是個人猜測意淫,所以我兩個會員都有,每月$50。
多问了几个问题。感觉Gemini升级了。可能有了更多时间想。也可能是调用了更高级模块。开始提出疑问。甚至打脸“自己”之前给的结论。有意思。

#12 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 6月 25日 06:37
Trump
magagop 写了: 2025年 6月 25日 00:53 我感覺Gemini搞教科書公式推導非常強,可能是谷歌把所有圖書館的書都掃描了,有獨到的訓練集。ChatGPT編程特別厲害,可能是微軟把Github代碼庫分享給OpenAI了。以上全是個人猜測意淫,所以我兩個會員都有,每月$50。
搭车问一下,chatgpt 的credit (就是我打到帐户的钱)有过期日吗?

#13 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 6月 25日 12:04
magagop
Trump 写了: 2025年 6月 25日 06:37 搭车问一下,chatgpt 的credit (就是我打到帐户的钱)有过期日吗?
這個不清楚

#14 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 7月 5日 20:48
goodegg
民科?
牛河梁 写了: 2025年 6月 24日 13:43 联系了一P/NP的老中作者。他前一段时间病了,正在修养中。

目前用ChatGPT和Grok均认可他的P=NP证明是对的。甚至一些作者自己担心的可能问题,这两Ai都不认为有问题。

考虑到ChatGPT和Grok都是作者选的平时用的。可能意见不够中立。万能的买提能否推荐第三个ChatBot用以验证。

要求:

1/ 独立于ChatGPT或Grok训练。特别是不能蒸馏于ChatGPT或Grok。

2/ 向全世界开放使用。最好有免费版。

3/ 能接收理解中文(计算机科学)问题。

#15 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 7月 5日 21:15
牛河梁
goodegg 写了: 2025年 7月 5日 20:48民科?
有谁自认在P vs NP问题上不是民科的。Cook?

#16 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 7月 7日 07:40
goodegg
你碰这些问题要小心大模型的回答。
现阶段只训练到能回答日常问题和低水平的数学物理问题。

高等级的数学和自然科学问题,你得自己判断
你要是没有自己判断对错的能力,让它来给你做决定,那基本上就要闹笑话。

牛河梁 写了: 2025年 7月 5日 21:15 有谁自认在P vs NP问题上不是民科的。Cook?

#17 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 7月 7日 07:42
goodegg
实际上你想要的东西还不存在。
牛河梁 写了: 2025年 6月 24日 13:43 联系了一P/NP的老中作者。他前一段时间病了,正在修养中。

目前用ChatGPT和Grok均认可他的P=NP证明是对的。甚至一些作者自己担心的可能问题,这两Ai都不认为有问题。

考虑到ChatGPT和Grok都是作者选的平时用的。可能意见不够中立。万能的买提能否推荐第三个ChatBot用以验证。

要求:

1/ 独立于ChatGPT或Grok训练。特别是不能蒸馏于ChatGPT或Grok。

2/ 向全世界开放使用。最好有免费版。

3/ 能接收理解中文(计算机科学)问题。

#18 Re: 请推荐一个公开可用能定理证明的大模型

发表于 : 2025年 7月 7日 10:22
牛河梁
goodegg 写了: 今天 07:40 你碰这些问题要小心大模型的回答。
现阶段只训练到能回答日常问题和低水平的数学物理问题。

高等级的数学和自然科学问题,你得自己判断
你要是没有自己判断对错的能力,让它来给你做决定,那基本上就要闹笑话。
工具是死的。人是活的。

1/ 老牛认为证明没问题。老牛贴过思路,买提表态过的如果不是同意也没看出有什么问题。

2/ LLM是读人写的论文训练出来的。提供了很多作者老牛都不知道的可能攻击思路(论文、观点)。这些都需要时间一一寻找原文(是否存在)并判读。

3/ 目前为止,老牛认为这些攻击都是错的。要么是常见的误区(人的思维误区也被LLM学习了);要么是研究人员一厢情愿引入的新的原问题里没有的限制条件。LLM也承认这些限制在问题原始描述里并不存在。

以上是一些使用工具后的进展。LLM不能给出证明。但能帮助理解读者可能的疑虑。哪怕读者们不愿意说出来。