新未名空间

隔壁版有人编排李飞飞，我作为当年参与者看不下去，说两句。

第一，这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走，机器视觉有点像CS里的火坑，用的是matlab。一帮子人去搞这么个不着边际的东西不容易，也就princeton级别的有这胆识。一作是把博士论文押在上面的。

第二，当年抓图用的是PlanetLab上数千台服务器。是有工程难度的，也得调动得了资源。这是06-07年的事情，AWS也就是同时才开始吹云计算。这事情概念上容易，真要干不是随便放哪里就能做出来的。

非要说工作量，工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的？

李飞飞和颜宁两个人，光工作量就不是一般人卷得过的。你们有啥好不服气的。

wdong 写了： 2025年 2月 9日 19:01 隔壁版有人编排李飞飞，我作为当年参与者看不下去，说两句。

第一，这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走，机器视觉有点像CS里的火坑，用的是matlab。一帮子人去搞这么个不着边际的东西不容易，也就princeton级别的有这胆识。一作是把博士论文押在上面的。

第二，当年抓图用的是PlanetLab上数千台服务器。是有工程难度的，也得调动得了资源。这是06-07年的事情，AWS也就是同时才开始吹云计算。这事情概念上容易，真要干不是随便放哪里就能做出来的。

非要说工作量，工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的？

李飞飞和颜宁两个人，光工作量就不是一般人卷得过的。你们有啥好不服气的。

你说的是STEM版有人贬低李飞飞。

我也不同意。

李飞飞做的imagenet是很重要的。催生了视觉人工智能的第一次飞跃。

视觉并没有做完。现在只做了一半：object segmentation可以说磕磕绊绊基本算做差不多了。

但是还有另一半：

1，空间智能，也就是物体之间的相对位置，或者视频中物体之间的相对速度。没有这个机器人不可能大行其道。

这也是李飞飞提出来的。所以李飞飞还是很厉害的。

2，另外还有：视觉还要接入语言模型。也就是视频要能转换成语言，而且是自然语言，而且转换出来的语言还能反过来复原视频，做到场景的复现。

这是我认为。

wdong 写了： 2025年 2月 9日 19:01 隔壁版有人编排李飞飞，我作为当年参与者看不下去，说两句。

第一，这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走，机器视觉有点像CS里的火坑，用的是matlab。一帮子人去搞这么个不着边际的东西不容易，也就princeton级别的有这胆识。一作是把博士论文押在上面的。

第二，当年抓图用的是PlanetLab上数千台服务器。是有工程难度的，也得调动得了资源。这是06-07年的事情，AWS也就是同时才开始吹云计算。这事情概念上容易，真要干不是随便放哪里就能做出来的。

非要说工作量，工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的？

李飞飞和颜宁两个人，光工作量就不是一般人卷得过的。你们有啥好不服气的。

我赞同你，李飞飞大局观很牛，STEM版那几个见识不行。

wdong 写了： 2025年 2月 9日 19:01 隔壁版有人编排李飞飞，我作为当年参与者看不下去，说两句。

第一，这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走，机器视觉有点像CS里的火坑，用的是matlab。一帮子人去搞这么个不着边际的东西不容易，也就princeton级别的有这胆识。一作是把博士论文押在上面的。

第二，当年抓图用的是PlanetLab上数千台服务器。是有工程难度的，也得调动得了资源。这是06-07年的事情，AWS也就是同时才开始吹云计算。这事情概念上容易，真要干不是随便放哪里就能做出来的。

非要说工作量，工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的？

李飞飞和颜宁两个人，光工作量就不是一般人卷得过的。你们有啥好不服气的。

跟颜宁放一块。。。

盐宁那些东西，没了她只不过换个人做。这年月最不缺的就是又有资源，又没什么特殊想法的。

李菲菲这个东西，至少还是极大推进了人类技术进步的，哪是一个档次的事。

wdong 写了： 2025年 2月 9日 19:01 隔壁版有人编排李飞飞，我作为当年参与者看不下去，说两句。

第一，这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走，机器视觉有点像CS里的火坑，用的是matlab。一帮子人去搞这么个不着边际的东西不容易，也就princeton级别的有这胆识。一作是把博士论文押在上面的。

第二，当年抓图用的是PlanetLab上数千台服务器。是有工程难度的，也得调动得了资源。这是06-07年的事情，AWS也就是同时才开始吹云计算。这事情概念上容易，真要干不是随便放哪里就能做出来的。

非要说工作量，工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的？

李飞飞和颜宁两个人，光工作量就不是一般人卷得过的。你们有啥好不服气的。

应该得图灵奖，四人帮

你说的这些有道理。但是现在更大的战场被开辟出来了，所以视觉的东西反而觉得不那么重要了。

汇编语言 -> {basic, fortran} -> Pascal/C -> {C++, java, python, ....} -> ... -> LLM = {所有自然预言，所有编程语言}

以前的电脑只能用电脑语言编程。LLM作为一个自动机，它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。这他妈是北美新大陆。这时候你再去垦地中海那点田还有意思吗？

现在所谓的prompt engineering，就是小孩蒙着眼睛在瞎玩。我目前的努力是试图建立起agent-oriented programming的体系，至少要争取占个坑将来查起来查得到我。

我对版上朋友的建议，就是参与到这个探索新世界的过程中来。现在谁都有机会占一片地。

huangchong 写了： 2025年 2月 9日 20:42 跟颜宁放一块。。。

盐宁那些东西，没了她只不过换个人做。这年月最不缺的就是又有资源，又没什么特殊想法的。

李菲菲这个东西，至少还是极大推进了人类技术进步的，哪是一个档次的事。

没有无缘无故的爱
也没有无缘无故的恨

群众不是无缘无故非议李的
初中生就能干的活
前瞻性魄力
这些东西
说破大天去
也不能服众
更何况现在imagenet已经not relevant 了

李飞飞最牛的是父母不明不白的到美国
去西藏净化
嫁白人
妥妥的白左的全球化炒作标本

wdong 写了： 2025年 2月 9日 20:51 你说的这些有道理。但是现在更大的战场被开辟出来了，所以视觉的东西反而觉得不那么重要了。

汇编语言 -> {basic, fortran} -> Pascal/C -> {C++, java, python, ....} -> ... -> LLM = {所有自然预言，所有编程语言}

以前的电脑只能用电脑语言编程。LLM作为一个自动机，它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。这他妈是北美新大陆。这时候你再去垦地中海那点田还有意思吗？

现在所谓的prompt engineering，就是小孩蒙着眼睛在瞎玩。我目前的努力是试图建立起agent-oriented programming的体系，至少要争取占个坑将来查起来查得到我。

我对版上朋友的建议，就是参与到这个探索新世界的过程中来。现在谁都有机会占一片地。

同意：“LLM作为一个自动机，它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。”

这个战场是AI agent。

这既是一个应用领域的战场，也是一个有理论意义的一个超级大迭代。

但是目前主要是一个应用领域的战场。AI数学和AI coding，等等。

理论意义上的超级大迭代，可能还是比较远的远景。

没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题，用agent的思路去做。现有的已经publish的路子效果不好 -- 这是大概率的事情，你发明个你的方法改进一点点，publish出来，说不定以后就成了经典算法。

Resnet很复杂吗？现在不都扎根到了所有模型里。我看过llama3的架构，每一层就是两个resnet。

wdong 写了： 2025年 2月 9日 21:02 没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题，用agent的思路去做。现有的已经publish的路子效果不好，你发明个你的方法，publish出来，说不定以后就成了经典算法。

Resnet很复杂吗？现在不都扎根到了所有模型里。我看过llama3的架构，每一层就是两个resnet。

当然，应用领域我也关心。

wdong 写了： 2025年 2月 9日 21:02 没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题，用agent的思路去做。现有的已经publish的路子效果不好 -- 这是大概率的事情，你发明个你的方法改进一点点，publish出来，说不定以后就成了经典算法。

Resnet很复杂吗？现在不都扎根到了所有模型里。我看过llama3的架构，每一层就是两个resnet。

llama3没有moe，让人诟病，据说是想train moe没有做出来，搞了一个dense model

李飞飞应该获奖，不管技术水平，贡献在那里

另一方面，学术上好像没有什么贡献，做公司产品目前没有什么进展，当然也可能跟Ilya一样，闭关练功

她的学生andrej karpathy水平不错

当年李飞飞自己在实验室鼓励学生的说法，就是他们机器视觉领域最厉害的人有两个，一个叫Pietro Perona，一个叫Jitendra Malik。Perona是Malik的学生（她自己是Perona的学生)。这俩人的学术贡献是什么有多少人还知道。

wdong 写了： 2025年 2月 9日 21:02 没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题，用agent的思路去做。现有的已经publish的路子效果不好 -- 这是大概率的事情，你发明个你的方法改进一点点，publish出来，说不定以后就成了经典算法。

Resnet很复杂吗？现在不都扎根到了所有模型里。我看过llama3的架构，每一层就是两个resnet。

视觉不做好，AI就不能以类人的方式工作。最简单一个travel agent就需要以API的方式工作。自动驾驶真的能上路吗？可能还是需要某种程度的车路协同。当然，改造各领域的工作环境以适应现在的AI，也是大的战场。

自动驾驶能上路难道还需要怀疑吗？而且自动驾驶技术做到上路还没用到LLM技术。你的要求系统性地高于我的要求。我看着过不了几年就能做出来，我就自动认为已经做出来了。

wdong 写了： 2025年 2月 9日 21:28 当年李飞飞自己在实验室鼓励学生的说法，就是他们机器视觉领域最厉害的人有两个，一个叫Pietro Perona，一个叫Jitendra Malik。Perona是Malik的学生（她自己是Perona的学生)。这俩人的学术贡献是什么有多少人还知道。

都是昔日黄花，都让dl给统一了

wdong 写了： 2025年 2月 9日 21:34 自动驾驶能上路难道还需要怀疑吗？而且自动驾驶技术做到上路还没用到LLM技术。你的要求系统性地高于我的要求。我看着过不了几年就能做出来，我就自动认为已经做出来了。

一个城市搞几百个点，这些点之间跑容易一点

wdong 写了： 2025年 2月 9日 21:28 当年李飞飞自己在实验室鼓励学生的说法，就是他们机器视觉领域最厉害的人有两个，一个叫Pietro Perona，一个叫Jitendra Malik。Perona是Malik的学生（她自己是Perona的学生)。这俩人的学术贡献是什么有多少人还知道。

我当年想学机器视觉，找了一本教科书来看，看了几天就放弃了。现在看来非常幸运，否则Alex net一出来这些老古董都进博物馆了。

wdong 写了： 2025年 2月 9日 20:51 你说的这些有道理。但是现在更大的战场被开辟出来了，所以视觉的东西反而觉得不那么重要了。

汇编语言 -> {basic, fortran} -> Pascal/C -> {C++, java, python, ....} -> ... -> LLM = {所有自然预言，所有编程语言}

以前的电脑只能用电脑语言编程。LLM作为一个自动机，它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。这他妈是北美新大陆。这时候你再去垦地中海那点田还有意思吗？

现在所谓的prompt engineering，就是小孩蒙着眼睛在瞎玩。我目前的努力是试图建立起agent-oriented programming的体系，至少要争取占个坑将来查起来查得到我。

我对版上朋友的建议，就是参与到这个探索新世界的过程中来。现在谁都有机会占一片地。

有道理，这个势头是很明显的了

现在LLM的基础层面能力还需要加强，推理能力刚刚开始涌现，这两年估计就可以看见明显的增强，或许会到超人类水平。

应用层面，agent是一个方向。

还有一个robot为什么不能像R1一样，把动作分解成很小然后再行动

提前两步是先烈，提前一步是先驱，后来的跟风。
以技术不够复杂来批评visionary是没有道理的。

新未名空间

写两句Imagenet

#1 写两句Imagenet

#2 Re: 写两句Imagenet

#3 Re: 写两句Imagenet

#4 Re: 写两句Imagenet

#5 Re: 写两句Imagenet

#6 Re: 写两句Imagenet

#7 Re: 写两句Imagenet

#8 Re: 写两句Imagenet

#9 Re: 写两句Imagenet

#10 Re: 写两句Imagenet

#11 Re: 写两句Imagenet

#12 Re: 写两句Imagenet

#14 Re: 写两句Imagenet

#15 Re: 写两句Imagenet

#16 Re: 写两句Imagenet

#17 Re: 写两句Imagenet

#18 Re: 写两句Imagenet

#19 Re: 写两句Imagenet

#20 Re: 写两句Imagenet

#21 Re: 写两句Imagenet