纯数学

TheMatrix · 帖子由 **TheMatrix楼主** » 2025年 10月 31日 09:42

纯数学就是不以应用为导向的数学。

resolution我感觉有点这个意思，站内帖子：Re: Galois cohomology。当然，也可能是我不了解历史，以这种方式切入，有点纯数学的意思。

还有比如Wolfram鼓吹的cellular automata，坐在那没事干，没事找事，任意组合，看看能组合出什么pattern来。也有纯数学的意思。

乃至目前绝大多数数学的研究方向，都是没事找事，闲着也是闲着，发展发展，看看能发展出个啥。这都是纯数学。

它的特点是，你还得为它找应用，努力的为它找应用，justify它存在的意义。这就是纯数学。

相反，有用的数学不需要为它找应用，都是应用driven的，是money driven的，巨大的money。比如LLM。

其实纯数学不需要为它找应用。你就承认你是闲着也是闲着，没事找事干点什么，尽量往前走，但是走到哪都可以停下。那你就踏实了。

这就叫海边拾贝。找到值钱的贝壳很难。但是找不找得到，你都是去那散步的。还要啥自行车啊？

TheMatrix · 帖子由 **TheMatrix楼主** » 2025年 10月 31日 09:53

TheMatrix · 帖子由 **TheMatrix楼主** » 2025年 10月 31日 10:01

还有一类是问题导向的。比如黎曼猜想。看起来目标很明确。但是太难了，够不着。实际上也是没有目标的。

就好像古人看到月亮想要登月。太难了，够不着。往哪个方向迈出第一步，都是没有道理的。你说我先去青藏高原，离月球近一点，没有意义。你说我盖个巴别塔，1000米高，也没有意义。

mmking

纯数学没用，就是游戏

TheMatrix · 帖子由 **TheMatrix楼主** » 2025年 10月 31日 10:52

mmking 写了： 2025年 10月 31日 10:02
纯数学没用，就是游戏

纯数学没（应）用，that's absolutely right, and echoes my original post.

FoxMe

恰恰相反。数论是不是纯数？数论有没有应用？

mmking

数学就是人类为了抽象世界做出来的工具

没用的工具，可以研究，但属于hobby了

TheMatrix 写了： 2025年 10月 31日 10:52
纯数学没（应）用，that's absolutely right, and echoes my original post.

mmking

能支持应用数学发展的，都是有用的数学

FoxMe 写了： 2025年 10月 31日 11:23
恰恰相反。数论是不是纯数？数论有没有应用？

TheMatrix · 帖子由 **TheMatrix楼主** » 2025年 10月 31日 11:59

mmking 写了： 2025年 10月 31日 11:43
能支持应用数学发展的，都是有用的数学

这么说吧。一旦有用，它就不叫纯数学了。

但是反过来讲，从没（应）用的纯数学，变成有用的数学，这是经常发生的。我觉得可以说有用的数学中有一半的情况是这么发生的。

举个例子，198x年代的back propagation，就是没用的纯数学。现在有用不？

mmking

鹅？back propagation本身就是为了NN提出来的啊

大部分“纯”数学，其实都是“应用”数学

没用的数学是指，你定义了1+1=3，2+7=5这套和现实没有联系的系统，就不是冲着有用去的。

所有对partial differential 的这些推导和close form的formula都是有强现实意义的。人类每天面对的都是无法用close form表示的世界，这才有了工程。数学足够强大的话，整个世界都是数学的

Grok：

1980年代的反向传播（Back Propagation）介绍
反向传播（Back Propagation，简称BP）是现代深度学习的核心算法，它于1986年正式被系统化提出并流行开来，标志着神经网络从“黑暗时代”走向复兴。以下从历史背景、原理、关键事件和影响四个方面简要介绍1980年代的BP。

历史背景：从沉寂到复兴
• 1960年代：感知机（Perceptron）兴起，但Minsky & Papert（1969）指出其无法解决XOR问题，导致神经网络研究陷入低谷（“AI寒冬”）。
• 1970年代：少数学者（如Paul Werbos）已提出类似BP的想法，但未引起关注。
• 1980年代初：连接主义（Connectionism）思潮复苏，Hinton、Rumelhart等人开始重新审视多层神经网络。
关键突破：1986年《Nature》论文
• 时间：1986年9月
• 论文：Learning representations by back-propagating errors 作者：David E. Rumelhart, Geoffrey E. Hinton, Ronald J. Williams
• 发表期刊：《Nature》（顶级科学期刊，极大提升影响力）
• 核心贡献：
◦ 提出误差反向传播算法，用于训练多层前馈神经网络（MLP）。
◦ 解决了“信用分配问题”（Credit Assignment Problem）：如何将输出误差合理分配给各层权重？
◦ 使用链式法则（Chain Rule）计算梯度，结合梯度下降自动调整权重。
这篇论文被认为是“深度学习第一波高潮”的起点。
BP算法原理（1980年代版本）
BP算法包含两个阶段：
1 前向传播（Forward Pass） 输入 → 隐藏层 → 输出层，计算预测值与真实值的误差（通常用均方误差MSE）。
2 反向传播（Backward Pass） 从输出层开始，逐层向前计算每个权重对总误差的偏导数（梯度），然后更新权重： $$ w{ij} \leftarrow w{ij} - \eta \cdot \frac{\partial E}{\partial w{ij}} $$ 其中：
◦ $E$：总误差
◦ $\eta$：学习率
◦ $\frac{\partial E}{\partial w{ij}}$：通过链式法则计算
关键激活函数：Sigmoid（如 $\sigma(x) = \frac{1}{1+e^{-x}}$），可微，适合链式求导。
1980年代的应用与局限
成就
局限
成功训练多层网络（如NETtalk：文本转语音）
训练慢（梯度消失问题）
引发连接主义热潮（PDP研究组）
需要大量计算资源（当时电脑很慢）
奠定现代深度学习基础
容易陷入局部最优
其他重要事件
• 1982年：Hopfield网络（递归网络）提出，激发兴趣。
• 1985年：Ackley, Hinton等提出玻尔兹曼机，使用随机采样。
• 1989年：LeCun用BP训练卷积神经网络（LeNet前身）识别手写数字。

总结：1986是分水岭
时间
事件
1986年前
神经网络被认为“没前途”
1986年
BP算法发表，《Nature》论文引爆研究
1986年后
连接主义复兴，奠定深度学习基础
一句话评价： 1986年的反向传播，让“死去”的神经网络重新学会了“思考”。

如果你需要BP的具体数学推导、代码实现（Python/PyTorch）或与现代深度学习的对比，可以继续告诉我！

TheMatrix 写了： 2025年 10月 31日 11:59
这么说吧。一旦有用，它就不叫纯数学了。

但是反过来讲，从没（应）用的纯数学，变成有用的数学，这是经常发生的。我觉得可以说有用的数学中有一半的情况是这么发生的。

举个例子，198x年代的back propagation，就是没用的纯数学。现在有用不？

TheMatrix · 帖子由 **TheMatrix楼主** » 2025年 10月 31日 12:45

mmking 写了： 2025年 10月 31日 12:08
鹅？back propagation本身就是为了NN提出来的啊

大部分“纯”数学，其实都是“应用”数学

没用的数学是指，你定义了1+1=3，2+7=5这套和现实没有联系的系统，就不是冲着有用去的。

所有对partial differential 的这些推导和close form的formula都是有强现实意义的。人类每天面对的都是无法用close form表示的世界，这才有了工程。数学足够强大的话，整个世界都是数学的

因为现在它有大用了，所以大家才争抢它的历史。198x年代，它就是没用的纯数学。

irisyuan · 帖子由 **irisyuan** » 2025年 10月 31日 12:50

数学从物理里面独立出来变成一个学科，没用是非常关键的一步

GreatCanada · 帖子由 **GreatCanada** » 2025年 10月 31日 12:53

mmking 写了： 2025年 10月 31日 12:08
鹅？back propagation本身就是为了NN提出来的啊

大部分“纯”数学，其实都是“应用”数学

没用的数学是指，你定义了1+1=3，2+7=5这套和现实没有联系的系统，就不是冲着有用去的。

所有对partial differential 的这些推导和close form的formula都是有强现实意义的。人类每天面对的都是无法用close form表示的世界，这才有了工程。数学足够强大的话，整个世界都是数学的

Grok：

1980年代的反向传播（Back Propagation）介绍
反向传播（Back Propagation，简称BP）是现代深度学习的核心算法，它于1986年正式被系统化提出并流行开来，标志着神经网络从“黑暗时代”走向复兴。以下从历史背景、原理、关键事件和影响四个方面简要介绍1980年代的BP。

历史背景：从沉寂到复兴
• 1960年代：感知机（Perceptron）兴起，但Minsky & Papert（1969）指出其无法解决XOR问题，导致神经网络研究陷入低谷（“AI寒冬”）。
• 1970年代：少数学者（如Paul Werbos）已提出类似BP的想法，但未引起关注。
• 1980年代初：连接主义（Connectionism）思潮复苏，Hinton、Rumelhart等人开始重新审视多层神经网络。

关键突破：1986年《Nature》论文
• 时间：1986年9月
• 论文：Learning representations by back-propagating errors 作者：David E. Rumelhart, Geoffrey E. Hinton, Ronald J. Williams
• 发表期刊：《Nature》（顶级科学期刊，极大提升影响力）
• 核心贡献：
◦ 提出误差反向传播算法，用于训练多层前馈神经网络（MLP）。
◦ 解决了“信用分配问题”（Credit Assignment Problem）：如何将输出误差合理分配给各层权重？
◦ 使用链式法则（Chain Rule）计算梯度，结合梯度下降自动调整权重。
这篇论文被认为是“深度学习第一波高潮”的起点。

BP算法原理（1980年代版本）
BP算法包含两个阶段：
1 前向传播（Forward Pass） 输入 → 隐藏层 → 输出层，计算预测值与真实值的误差（通常用均方误差MSE）。
2 反向传播（Backward Pass） 从输出层开始，逐层向前计算每个权重对总误差的偏导数（梯度），然后更新权重： $$ w{ij} \leftarrow w{ij} - \eta \cdot \frac{\partial E}{\partial w{ij}} $$ 其中：
◦ $E$：总误差
◦ $\eta$：学习率
◦ $\frac{\partial E}{\partial w{ij}}$：通过链式法则计算
关键激活函数：Sigmoid（如 $\sigma(x) = \frac{1}{1+e^{-x}}$），可微，适合链式求导。

1980年代的应用与局限
成就
局限
成功训练多层网络（如NETtalk：文本转语音）
训练慢（梯度消失问题）
引发连接主义热潮（PDP研究组）
需要大量计算资源（当时电脑很慢）
奠定现代深度学习基础
容易陷入局部最优

其他重要事件
• 1982年：Hopfield网络（递归网络）提出，激发兴趣。
• 1985年：Ackley, Hinton等提出玻尔兹曼机，使用随机采样。
• 1989年：LeCun用BP训练卷积神经网络（LeNet前身）识别手写数字。

总结：1986是分水岭
时间
事件
1986年前
神经网络被认为“没前途”
1986年
BP算法发表，《Nature》论文引爆研究
1986年后
连接主义复兴，奠定深度学习基础
一句话评价： 1986年的反向传播，让“死去”的神经网络重新学会了“思考”。

如果你需要BP的具体数学推导、代码实现（Python/PyTorch）或与现代深度学习的对比，可以继续告诉我！

BP这东西就是典型微分里面chain rule的应用吧，应用的不能再应用的东西

mmking

羊拉鲲的CNN 1989就用把BP在邮编识别上了

这个例子不好，本身就是为应用搞的东西

Jeff Hinton本身也不是搞数学的，就是为了AI搞的理论。如果这是纯数学，现在大部分能看的PHD thesis都是纯数学

Hinton pioneered foundational techniques in deep learning, focusing on how neural networks mimic brain processes to learn from data:
• Boltzmann Machine (1983–1985): Used statistical physics to create a generative model for recognizing patterns in data, enabling unsupervised learning.
• Backpropagation Algorithm (1986): Co-authored a seminal paper with David Rumelhart and Ronald Williams, popularizing this method for training multi-layer neural networks—essential for modern AI.

TheMatrix 写了： 2025年 10月 31日 12:45
因为现在它有大用了，所以大家才争抢它的历史。198x年代，它就是没用的纯数学。

mmking

OMG

高中刚毕业？

irisyuan 写了： 2025年 10月 31日 12:50
数学从物理里面独立出来变成一个学科，没用是非常关键的一步

GreatCanada · 帖子由 **GreatCanada** » 2025年 10月 31日 12:59

mmking 写了： 2025年 10月 31日 12:55
羊拉鲲的CNN 1989就用把BP在邮编识别上了

这个例子不好，本身就是为应用搞的东西

Jeff Hinton本身也不是搞数学的，就是为了AI搞的理论。如果这是纯数学，现在大部分能看的PHD thesis都是纯数学

Hinton pioneered foundational techniques in deep learning, focusing on how neural networks mimic brain processes to learn from data:
• Boltzmann Machine (1983–1985): Used statistical physics to create a generative model for recognizing patterns in data, enabling unsupervised learning.
• Backpropagation Algorithm (1986): Co-authored a seminal paper with David Rumelhart and Ronald Williams, popularizing this method for training multi-layer neural networks—essential for modern AI.

张一唐搞得西格玛零点才能算纯数学，另外玻尔兹曼机和反向传导是两个不同的东西

mmking

属实

很多人看见公式看不懂就以为是纯数学，把很多工程师捧成了数学家

GreatCanada 写了： 2025年 10月 31日 12:59
张一唐搞得西格玛零点才能算纯数学，另外玻尔兹曼机和反向传导是两个不同的东西

princeton

“物理是大道，化学是偶遇，数学是人手里的泥巴，随你捏”
：-）

mmking

人在偶遇的大道上，泥巴就是最持久的真的工具了

princeton 写了： 2025年 10月 31日 15:03
“物理是大道，化学是偶遇，数学是人手里的泥巴，随你捏”
：-）

Riikanbkk

lol 以前看Shelah 大神写的集合论的关注动力，

根基/哲学................1分
应用于其它数学领域 ...3分
历史原因.................3分
领域内部动力...........4分
美丽......................9分，这是最大动力！
硬核内涵的证明........5分
推广......................6分
智力游戏................3分，最流行的选项

新未名空间

纯数学

#1 纯数学

#2 Re: 纯数学

#3 Re: 纯数学

#4 Re: 纯数学

#5 Re: 纯数学

#6 Re: 纯数学

#7 Re: 纯数学

#8 Re: 纯数学

#9 Re: 纯数学

#10 Re: 纯数学

#11 Re: 纯数学

#12 Re: 纯数学

#13 Re: 纯数学

#14 Re: 纯数学

#15 Re: 纯数学

#16 Re: 纯数学

#17 Re: 纯数学

#18 Re: 纯数学

#19 Re: 纯数学

#20 Re: 纯数学