分页: 1 / 1

#1 写两句Imagenet

发表于 : 2025年 2月 9日 19:01
wdong
隔壁版有人编排李飞飞,我作为当年参与者看不下去,说两句。

第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。

第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。

非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?


李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。

#2 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 20:28
TheMatrix
wdong 写了: 2025年 2月 9日 19:01 隔壁版有人编排李飞飞,我作为当年参与者看不下去,说两句。

第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。

第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。

非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?


李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。
你说的是STEM版有人贬低李飞飞。

我也不同意。

李飞飞做的imagenet是很重要的。催生了视觉人工智能的第一次飞跃。

视觉并没有做完。现在只做了一半:object segmentation可以说磕磕绊绊基本算做差不多了。

但是还有另一半:

1,空间智能,也就是物体之间的相对位置,或者视频中物体之间的相对速度。没有这个机器人不可能大行其道。

这也是李飞飞提出来的。所以李飞飞还是很厉害的。

2,另外还有:视觉还要接入语言模型。也就是视频要能转换成语言,而且是自然语言,而且转换出来的语言还能反过来复原视频,做到场景的复现。

这是我认为。

#3 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 20:41
Caravel
wdong 写了: 2025年 2月 9日 19:01 隔壁版有人编排李飞飞,我作为当年参与者看不下去,说两句。

第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。

第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。

非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?


李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。
我赞同你,李飞飞大局观很牛,STEM版那几个见识不行。

#4 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 20:42
huangchong
wdong 写了: 2025年 2月 9日 19:01 隔壁版有人编排李飞飞,我作为当年参与者看不下去,说两句。

第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。

第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。

非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?


李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。
跟颜宁放一块。。。

盐宁那些东西,没了她只不过换个人做。这年月最不缺的就是又有资源,又没什么特殊想法的。

李菲菲这个东西, 至少还是极大推进了人类技术进步的,哪是一个档次的事。

#5 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 20:47
wass
wdong 写了: 2025年 2月 9日 19:01 隔壁版有人编排李飞飞,我作为当年参与者看不下去,说两句。

第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。

第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。

非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?


李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。
应该得图灵奖,四人帮

#6 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 20:51
wdong
你说的这些有道理。但是现在更大的战场被开辟出来了,所以视觉的东西反而觉得不那么重要了。

汇编语言 -> {basic, fortran} -> Pascal/C -> {C++, java, python, ....} -> ... -> LLM = {所有自然预言,所有编程语言}

以前的电脑只能用电脑语言编程。LLM作为一个自动机,它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。这他妈是北美新大陆。这时候你再去垦地中海那点田还有意思吗?

现在所谓的prompt engineering,就是小孩蒙着眼睛在瞎玩。我目前的努力是试图建立起agent-oriented programming的体系,至少要争取占个坑将来查起来查得到我。

我对版上朋友的建议,就是参与到这个探索新世界的过程中来。现在谁都有机会占一片地。

#7 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 20:56
hahan
huangchong 写了: 2025年 2月 9日 20:42 跟颜宁放一块。。。

盐宁那些东西,没了她只不过换个人做。这年月最不缺的就是又有资源,又没什么特殊想法的。

李菲菲这个东西, 至少还是极大推进了人类技术进步的,哪是一个档次的事。
没有无缘无故的爱
也没有无缘无故的恨

群众不是无缘无故非议李的
初中生就能干的活
前瞻性 魄力
这些东西
说破大天去
也不能服众
更何况现在imagenet已经not relevant 了

李飞飞最牛的是父母不明不白的到美国
去西藏净化
嫁白人
妥妥的白左的全球化炒作标本

#8 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 20:59
TheMatrix
wdong 写了: 2025年 2月 9日 20:51 你说的这些有道理。但是现在更大的战场被开辟出来了,所以视觉的东西反而觉得不那么重要了。

汇编语言 -> {basic, fortran} -> Pascal/C -> {C++, java, python, ....} -> ... -> LLM = {所有自然预言,所有编程语言}

以前的电脑只能用电脑语言编程。LLM作为一个自动机,它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。这他妈是北美新大陆。这时候你再去垦地中海那点田还有意思吗?

现在所谓的prompt engineering,就是小孩蒙着眼睛在瞎玩。我目前的努力是试图建立起agent-oriented programming的体系,至少要争取占个坑将来查起来查得到我。

我对版上朋友的建议,就是参与到这个探索新世界的过程中来。现在谁都有机会占一片地。
同意:“LLM作为一个自动机,它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。”

这个战场是AI agent。

这既是一个应用领域的战场,也是一个有理论意义的一个超级大迭代。

但是目前主要是一个应用领域的战场。AI数学和AI coding,等等。

理论意义上的超级大迭代,可能还是比较远的远景。

#9 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 21:02
wdong
没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题,用agent的思路去做。现有的已经publish的路子效果不好 -- 这是大概率的事情,你发明个你的方法改进一点点,publish出来,说不定以后就成了经典算法。

Resnet很复杂吗?现在不都扎根到了所有模型里。我看过llama3的架构,每一层就是两个resnet。

#10 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 21:04
TheMatrix
wdong 写了: 2025年 2月 9日 21:02 没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题,用agent的思路去做。现有的已经publish的路子效果不好,你发明个你的方法,publish出来,说不定以后就成了经典算法。

Resnet很复杂吗?现在不都扎根到了所有模型里。我看过llama3的架构,每一层就是两个resnet。
当然,应用领域我也关心。

#11 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 21:08
wass
wdong 写了: 2025年 2月 9日 21:02 没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题,用agent的思路去做。现有的已经publish的路子效果不好 -- 这是大概率的事情,你发明个你的方法改进一点点,publish出来,说不定以后就成了经典算法。

Resnet很复杂吗?现在不都扎根到了所有模型里。我看过llama3的架构,每一层就是两个resnet。
llama3没有moe,让人诟病,据说是想train moe没有做出来,搞了一个dense model

#12 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 21:15
wass
李飞飞应该获奖,不管技术水平,贡献在那里

另一方面,学术上好像没有什么贡献,做公司产品目前没有什么进展,当然也可能跟Ilya一样,闭关练功

她的学生andrej karpathy水平不错

#14 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 21:28
wdong
当年李飞飞自己在实验室鼓励学生的说法,就是他们机器视觉领域最厉害的人有两个,一个叫Pietro Perona,一个叫Jitendra Malik。Perona是Malik的学生(她自己是Perona的学生)。这俩人的学术贡献是什么有多少人还知道。

#15 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 21:29
TheMatrix
wdong 写了: 2025年 2月 9日 21:02 没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题,用agent的思路去做。现有的已经publish的路子效果不好 -- 这是大概率的事情,你发明个你的方法改进一点点,publish出来,说不定以后就成了经典算法。

Resnet很复杂吗?现在不都扎根到了所有模型里。我看过llama3的架构,每一层就是两个resnet。
视觉不做好,AI就不能以类人的方式工作。最简单一个travel agent就需要以API的方式工作。自动驾驶真的能上路吗?可能还是需要某种程度的车路协同。当然,改造各领域的工作环境以适应现在的AI,也是大的战场。

#16 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 21:34
wdong
自动驾驶能上路难道还需要怀疑吗?而且自动驾驶技术做到上路还没用到LLM技术。你的要求系统性地高于我的要求。我看着过不了几年就能做出来,我就自动认为已经做出来了。

#17 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 23:51
wass
wdong 写了: 2025年 2月 9日 21:28 当年李飞飞自己在实验室鼓励学生的说法,就是他们机器视觉领域最厉害的人有两个,一个叫Pietro Perona,一个叫Jitendra Malik。Perona是Malik的学生(她自己是Perona的学生)。这俩人的学术贡献是什么有多少人还知道。
都是昔日黄花,都让dl给统一了

#18 Re: 写两句Imagenet

发表于 : 2025年 2月 9日 23:58
wass
wdong 写了: 2025年 2月 9日 21:34 自动驾驶能上路难道还需要怀疑吗?而且自动驾驶技术做到上路还没用到LLM技术。你的要求系统性地高于我的要求。我看着过不了几年就能做出来,我就自动认为已经做出来了。
一个城市搞几百个点,这些点之间跑容易一点

#19 Re: 写两句Imagenet

发表于 : 2025年 2月 10日 12:28
Caravel
wdong 写了: 2025年 2月 9日 21:28 当年李飞飞自己在实验室鼓励学生的说法,就是他们机器视觉领域最厉害的人有两个,一个叫Pietro Perona,一个叫Jitendra Malik。Perona是Malik的学生(她自己是Perona的学生)。这俩人的学术贡献是什么有多少人还知道。
我当年想学机器视觉,找了一本教科书来看,看了几天就放弃了。现在看来非常幸运,否则Alex net一出来这些老古董都进博物馆了。

#20 Re: 写两句Imagenet

发表于 : 2025年 2月 10日 12:50
Caravel
wdong 写了: 2025年 2月 9日 20:51 你说的这些有道理。但是现在更大的战场被开辟出来了,所以视觉的东西反而觉得不那么重要了。

汇编语言 -> {basic, fortran} -> Pascal/C -> {C++, java, python, ....} -> ... -> LLM = {所有自然预言,所有编程语言}

以前的电脑只能用电脑语言编程。LLM作为一个自动机,它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。这他妈是北美新大陆。这时候你再去垦地中海那点田还有意思吗?

现在所谓的prompt engineering,就是小孩蒙着眼睛在瞎玩。我目前的努力是试图建立起agent-oriented programming的体系,至少要争取占个坑将来查起来查得到我。

我对版上朋友的建议,就是参与到这个探索新世界的过程中来。现在谁都有机会占一片地。
有道理,这个势头是很明显的了

现在LLM的基础层面能力还需要加强,推理能力刚刚开始涌现,这两年估计就可以看见明显的增强,或许会到超人类水平。

应用层面,agent是一个方向。

还有一个robot为什么不能像R1一样,把动作分解成很小然后再行动

#21 Re: 写两句Imagenet

发表于 : 2025年 2月 10日 17:31
fantasist
提前两步是先烈,提前一步是先驱,后来的跟风。
以技术不够复杂来批评visionary是没有道理的。