10年内AI应该有大突破

hci

Hoffman是Marr的学生。Marr的认知层次理论，也是非常重要的。这两个人的理论我都是比较认同的。

O3-min:

David Marr 是视觉科学领域的重要人物，他提出了一套理解视觉信息处理的理论框架，其核心思想主要体现在以下几个方面：

1. 三级分析理论
Marr 认为，要理解任何信息处理系统（尤其是人类视觉系统），必须在三个层次上加以分析：
a. 计算层次（Computational Level）：探讨视觉系统究竟解决什么问题，即任务的目标和优化准则。例如，如何从二维影像中推断三维世界的结构。
b. 算法层次（Algorithmic Level）：研究具体的表示和算法，即系统采用什么样的中间表示以及如何将输入信息转化为目标表示。
c. 实现层次（Implementational Level）：关注系统如何在物理载体上实现，也就是神经系统中的具体实现方式。
Marr 强调，理解视觉必须从这三个层面同时展开，而不仅仅停留在生物学的实现上或抽象的计算目标上。

2. 从刺激到知觉的多阶段处理
在他的代表作《Vision: A Computational Investigation into the Human Representation and Processing of Visual Information》中，Marr 阐述了视觉处理的多个阶段：
a. 原始草图（Primal Sketch）：初步提取图像中的边缘、亮度变化和纹理等特征，这一阶段提取出能够描述基本图形和结构的信息。
b. 2.5D 草图（2.5D Sketch）：在这一阶段，系统利用初步特征构造出观察者视角下的局部三维结构描述，考虑物体表面的形状和深度关系，但这种表示仍然依赖于观察者的位置。
c. 三维模型表示（3D Model Representation）：最终构造出一个与观察者无关的完整三维模型，使得物体可以从任意角度进行识别和理解。

3. 理论与实践的结合
Marr 的理论不仅提供了对视觉过程抽象模型的分析框架，也激发了后续对视觉算法、计算机视觉以及神经科学研究的深入探讨。他的工作促使学者们从计算目的和算法设计的角度重新审视生物视觉系统，同时也为构建人工视觉系统提供了理论指导。

总的来说，David Marr 的理论主张：
– 理解视觉必须从确定“为什么”以及“做什么”开始，然后逐步探讨“如何做”和“用什么实现”。
– 视觉系统通过多个阶段，从原始视觉输入逐步构造出对三维世界的理解，其中每个阶段都有各自的表示和处理机制。
– 分析问题时必须区分计算、算法和实现三个层次，这样才能全面把握系统的运作原理。

这一理论框架极大地影响了计算神经科学和人工智能领域，成为理解和模拟复杂信息处理系统的重要指导思想。

hci 写了： 2025年 2月 3日 13:29 Donald Hoffman的界面理论

O3-mini

Donald Hoffman 的界面理论（Interface Theory of Perception）主要观点在于，人类和其他生物的感知系统并非直接反映现实世界的本质，而是构造出一个“用户界面”，使我们能够高效生存和适应环境。其核心思想可以概括为以下几点：

1. 感知与真相的分离
• Hoffman 认为，我们所感知的世界并非客观真相，而只是经过长期进化的适应性界面。正如计算机桌面上的图标并不揭示计算机硬件的真实构造，这一界面仅以简单、直接的方式向我们呈现环境中对生存有用的信息。
• 这种观点挑战了传统认为感知系统旨在提供真实、完整描述现实的观点。

2. 适应性而非真实再现
• 演化过程中，生物体注重的是适应与生存，而非获取或展现世界的“真相”。
• 换言之，感知系统被“设计”出来使生物能够迅速做出有助于生存和繁衍的决策，即使这意味着对真实世界的信息做出极大简化甚至扭曲。

3. 感知界面的实用性
• 像计算机界面那样，感知界面隐藏了现实中的复杂细节，仅展示那些与生存和决策直接相关的要素。
• 这种观点暗示如果我们要看到“真实”的世界结构，可能需要超出人类进化所塑造的感知方式的工具或方法。

4. 对实在论的挑战
• Hoffman 的理论质疑了传统的“直接感知”或“真实再现”观念，认为进化选择实际上倾向于构建一种“有用的幻觉”，而不是真实反映世界的全部细节。
• 他指出，与其说我们的感知是为了揭示世界本质，不如说它们是为了使我们能在一个充满风险与竞争的环境中存活下来。

总结起来，Donald Hoffman 的界面理论主张：感知系统的目的不是为了呈现客观现实的真实“内部结构”，而是为了提供一个简化且高度实用的界面，让生物体能迅速做出适应性反应，从而更好地生存和繁衍。这一理论激发了人们对“现实是什么”以及“我们如何认识现实”的根本性思考。

hci

他的意思，用传统的认知心理学的信息处理框架，就是下行（top down）比上行（bottom up）重要。人看到的是什么，主要是由意识想看到什么决定的。而知觉不过是个用户界面。这个用户是谁呢？用户就是意识。

其实这与道教的元神识神理论，已经差得不远了。

hci 写了： 2025年 2月 3日 13:29 Donald Hoffman的界面理论

O3-mini

Donald Hoffman 的界面理论（Interface Theory of Perception）主要观点在于，人类和其他生物的感知系统并非直接反映现实世界的本质，而是构造出一个“用户界面”，使我们能够高效生存和适应环境。其核心思想可以概括为以下几点：

1. 感知与真相的分离
• Hoffman 认为，我们所感知的世界并非客观真相，而只是经过长期进化的适应性界面。正如计算机桌面上的图标并不揭示计算机硬件的真实构造，这一界面仅以简单、直接的方式向我们呈现环境中对生存有用的信息。
• 这种观点挑战了传统认为感知系统旨在提供真实、完整描述现实的观点。

2. 适应性而非真实再现
• 演化过程中，生物体注重的是适应与生存，而非获取或展现世界的“真相”。
• 换言之，感知系统被“设计”出来使生物能够迅速做出有助于生存和繁衍的决策，即使这意味着对真实世界的信息做出极大简化甚至扭曲。

3. 感知界面的实用性
• 像计算机界面那样，感知界面隐藏了现实中的复杂细节，仅展示那些与生存和决策直接相关的要素。
• 这种观点暗示如果我们要看到“真实”的世界结构，可能需要超出人类进化所塑造的感知方式的工具或方法。

4. 对实在论的挑战
• Hoffman 的理论质疑了传统的“直接感知”或“真实再现”观念，认为进化选择实际上倾向于构建一种“有用的幻觉”，而不是真实反映世界的全部细节。
• 他指出，与其说我们的感知是为了揭示世界本质，不如说它们是为了使我们能在一个充满风险与竞争的环境中存活下来。

总结起来，Donald Hoffman 的界面理论主张：感知系统的目的不是为了呈现客观现实的真实“内部结构”，而是为了提供一个简化且高度实用的界面，让生物体能迅速做出适应性反应，从而更好地生存和繁衍。这一理论激发了人们对“现实是什么”以及“我们如何认识现实”的根本性思考。

hci

我的硕士论文做实验，研究内源性和外源性选择性注意。实验用到的能引起外源性注意的一种刺激，叫作abrupt onset ，就是一个东西突然在视野中出现，我把它中文翻译成“突显”。突显会引起对突显出现的视野的注意加强（也就是对这一区域的刺激的反应的反应时变短），而且这是不受人控制的。

生物这种对突显的选择性注意，虽然是外源性注意，但其实就是一种本能，是系统内置的，并不是学习来的。所以本质上也是内源的，是下行控制的一种方式。就是我前面说到的天生的系统算法的“筛子”的一种。这个解释是符合“用户界面”理论的。

hci 写了： 2025年 2月 3日 13:43 他的意思，用传统的认知心理学的信息处理框架，就是下行（top down）比上行（bottom up）重要。人看到的是什么，主要是由意识想看到什么决定的。而知觉不过是个用户界面。这个用户是谁呢？用户就是意识。

其实这与道教的元神识神理论，已经差得不远了。

jiujianoufu · 帖子由 **jiujianoufu** » 2025年 2月 3日 20:24

AI 的最基本的外围现在都还不清楚，AI动力学更加是没有影子的事情，AI在30年内都不可能有很大突破，除非能出现牛顿式的人物。

duiduilu2 · 帖子由 **duiduilu2（abc）** » 2025年 2月 3日 23:18

hci 写了： 2025年 2月 3日 12:42 Genesis是根据伏羲的自传篡改的。

本来是讲伏羲带50人的探险队来到地球建立基地的过程。“要有光“，是伏羲降落地球吩咐队员们干的第一件事，那就是建立照明系统，这样才能展开基地的建设。6天后，基地建设完工，让大家休息一天。对于伏羲这些外星人来说，地球自转太快，觉得一下就天黑了，一下又亮了，非常不适应，所以建立恒定的照明是第一要务。

宇宙最早出现的不是光，而是水。 ”太一生水“。

伏羲带50人的探险队....HCI，你和你老婆是不是队员啊，我怀疑。

hci

你心目中点子上的定义是啥？

语言？

wdong 写了： 2025年 2月 3日 06:31 我同意符号系统是接下来的一大金矿。可能也是唯一的金矿。怎么搞应该大家各有各的玩法。我大概也有些idea了。Agent做出来后的下一步就是用agent搞这个。

我的想法比较简单，智能是语言现象。语言模型是核心。跟混合不混合没关系。之前对于智能有各种定义，下棋啦，识别图像了，都没定义到点子上，所以实现了再回过头看都不是智能。

wdong

hci 写了： 2025年 2月 4日 01:19 你心目中点子上的定义是啥？

语言？

智能是语言现象，人类智能也是语言现象。再往上，就是群体性语言现象。

hci

也就是说你的理解类似于Fodor? 或者是别的什么意思？

评述Fodor的思维语言假说：

O3-mini

Jerry Fodor 的思维语言理论（亦称“心智语言假说”）主张，人的思维过程依赖于一种内在的、具有形式语法和语义的“心智语言”（Language of Thought, LOT）。这一理论试图形而上地解释认知过程，认为心智中的信息是以符号结构的形式存储和操作的，类似于计算机程序中的编码。以下是对此理论的评述：

1. 核心观点
a. 符号表示与组合性：Fodor 借鉴了当时计算机科学的发展，认为心理表征应与自然语言类似，具有组合性（compositionality）。也就是说，复杂思维可以由简单符号通过语法规则组合而成。
b. 内在语法与计算性质：理论认为人的心智是通过一种类语言的内部系统来组织和处理信息，这种系统包含语法规则，支持推理、计划与决策，从而实现类似计算机算法的操作。
c. 先天性：Fodor 主张这样的心智语言在某种程度上是先天的，它构成了人类认知的基础，为后天学习提供框架。

2. 理论贡献
a. 为认知科学奠定计算主义基础：Fodor 的思维语言理论使得认知成为一门可以用符号操作和算法来描述的科学，这对后来的认知心理学、人工智能等领域产生了深远影响。
b. 阐释系统性与生成性：通过心智语言的观点，理论能够解释为何人类语言和思维具有系统性（相似结构的思想之间存在固定关系）与生成性（有限的规则能生成无限多的话语和判断）。
c. 对自然语言理解的启示：此理论为研究语言理解提供了一种框架，即自然语言的意义可能建立在更基本的心理符号系统之上。

3. 主要批评与争议
a. 实证依据不足：批评者指出，虽然该理论在哲学和理论层面具有吸引力，但缺乏明确的神经生物学依据。神经科学的研究尚难以确定有无存在类似“内在语言”的具体实现。
b. 与连接主义模型的张力：20世纪末至今，许多研究倾向于采用分布式、连接主义的模型（如神经网络）来解释认知现象，这一观点与传统符号处理方法存在冲突。批评者认为，复杂的认知过程更可能通过大量简单单元的连接和并行处理来实现，而非依赖于类似程序语言的符号系统。
c. 过于计算主义与抽象化：有学者认为，Fodor 的理论高度形式化，可能忽视了情境、情感以及体验在认知过程中的作用。特别是在解释非语言思维（如直觉、情感或艺术创作）时，传统的符号机制似乎显得不足。
d. 语言-思维关系的争论：虽然该理论主张存在一种先于自然语言的心智语言，但关于这种心智语言是否存在，以及它与可观察自然语言之间关系的具体本质，争议仍然存在。

4. 当代发展与影响
a. 理论的延续与修正：尽管面临诸多批评，Fodor 的观点对认知科学和人工智能领域产生了广泛的影响。不少研究者试图在解释分布式处理的同时纳入符号操控的成分，提出混合模型。
b. 跨学科对话：心智语言理论激发了语言学、哲学、心理学乃至神经科学之间的交叉讨论，推动了对人类心智本质的多角度探讨。

总结来说，Fodor 的思维语言理论为理解认知提供了一个富有启发性的框架，强调了符号系统和计算机制在思维中的核心作用。尽管这一理论在实证支持和解释范围上存在争议，但它仍然是认知科学史上里程碑式的理论，对后续学者产生了深远影响。未来的研究或许能通过结合连接主义、神经科学和符号处理等多种模式，更全面地解析人类复杂的认知过程。

wdong 写了： 2025年 2月 4日 06:32 智能是语言现象，人类智能也是语言现象。再往上，就是群体性语言现象。

hci

AI动力学是什么？

jiujianoufu 写了： 2025年 2月 3日 20:24 AI 的最基本的外围现在都还不清楚，AI动力学更加是没有影子的事情，AI在30年内都不可能有很大突破，除非能出现牛顿式的人物。

wdong

hci 写了： 2025年 2月 4日 10:41 AI动力学是什么？

计算机的东西有什么动力学？

hci

我也好奇呀。

学物理的喜欢说“动力学”，大致是没有动力学，就没法算具体问题？

那计算机本身就有动力学呀，编程实现跑起来了，不就有动力学了么？至于理论上的动力学，在计算机科学界，其实很多是事后诸葛亮。比如现在的AI，也是都已经实现并工作了，但不知道为啥工作，理论并没有跟上。

当然我这么说，搞理论计算机的很生气。可事实如此。

wdong 写了： 2025年 2月 4日 12:00 计算机的东西有什么动力学？

hahan · 帖子由 **hahan** » 2025年 2月 4日 22:34

hci 写了： 2025年 2月 2日 15:50 LLM是不管输入输出的格式的，都一样的工作。LLM已经涵盖了人类的知识，只是它的知识结构人类不能直接访问，现在我们是用自然语言问题，它用自然语言回答，但是，让它用符号系统能接受的输入形式来回答，也是一样的。比如现在的LLM就可以让它用JSON回答，而不是用自然语言回答。符号系统需要的输入其实与这差不多。

也就是让LLM来做这个翻译官。以前的老AI让人来做翻译官，把人类的知识变成规则，现在用LLM。我说过，LLM写起declarative的逻辑程序来，那水平是钢钢的，并不需要见过很多语料，因为declarative的逻辑程序本身非常简单，而且是高度模式化的。人学起来也很容易，所以LLM学很简单。

就这。

明白了？

这个不就是agent

jgljk · 帖子由 **jgljk** » 2025年 2月 4日 23:18

hci 写了： 2025年 2月 3日 12:42 Genesis是根据伏羲的自传篡改的。

本来是讲伏羲带50人的探险队来到地球建立基地的过程。“要有光“，是伏羲降落地球吩咐队员们干的第一件事，那就是建立照明系统，这样才能展开基地的建设。6天后，基地建设完工，让大家休息一天。对于伏羲这些外星人来说，地球自转太快，觉得一下就天黑了，一下又亮了，非常不适应，所以建立恒定的照明是第一要务。

宇宙最早出现的不是光，而是水。 ”太一生水“。

伏羲女娲是伊甸园忽悠夏娃的那条蛇，或是那个种类的。

TSING · 帖子由 **TSING** » 2025年 2月 4日 23:21

大突破 No
大泡沫 Yes

hci

犹太教是憎恨人类的恩利爾传播的邪惡宗教。伊甸园就是恩利尔的后花园。当他知道了这波聰明的人类是恩基的后代之后，大发雷霆，把人类奴隶从家都趕走了。

jgljk 写了： 2025年 2月 4日 23:18 伏羲女娲是伊甸园忽悠夏娃的那条蛇，或是那个种类的。

hci

就是agent。agent本来就是我宣传的概念。

hahan 写了： 2025年 2月 4日 22:34 这个不就是agent

duiduilu2 · 帖子由 **duiduilu2（abc）** » 2025年 2月 5日 11:14

hci 写了： 2025年 2月 5日 10:43 犹太教是憎恨人类的恩利爾传播的邪惡宗教。伊甸园就是恩利尔的后花园。当他知道了这波聰明的人类是恩基的后代之后，大发雷霆，把人类奴隶从家都趕走了。

HCI，你跟书说实话，你有没有吃抑郁药。我心理学比你懂，你别装。

jgljk · 帖子由 **jgljk** » 2025年 2月 6日 05:38

hci 写了： 2025年 2月 5日 10:43 犹太教是憎恨人类的恩利爾传播的邪惡宗教。伊甸园就是恩利尔的后花园。当他知道了这波聰明的人类是恩基的后代之后，大发雷霆，把人类奴隶从家都趕走了。

随你怎么说吧，你高兴就好。

NadiaZ · 帖子由 **NadiaZ** » 2025年 2月 6日 05:56

存了，今年最好的讨论

toddj · 帖子由 **toddj** » 2025年 2月 6日 12:17

hci讲的很好啊

新未名空间

10年内AI应该有大突破

#82 Re: 10年内AI应该有大突破

#83 Re: 10年内AI应该有大突破

#84 Re: 10年内AI应该有大突破

#86 Re: 10年内AI应该有大突破

#87 Re: 10年内AI应该有大突破

#88 Re: 10年内AI应该有大突破

#89 Re: 10年内AI应该有大突破

#90 Re: 10年内AI应该有大突破

#91 Re: 10年内AI应该有大突破

#92 Re: 10年内AI应该有大突破

#93 Re: 10年内AI应该有大突破

#94 Re: 10年内AI应该有大突破

#95 Re: 10年内AI应该有大突破

#96 Re: 10年内AI应该有大突破

#97 Re: 10年内AI应该有大突破

#98 Re: 10年内AI应该有大突破

#99 Re: 10年内AI应该有大突破

#100 Re: 10年内AI应该有大突破

#101 Re: 10年内AI应该有大突破

#102 Re: 10年内AI应该有大突破