FSD的纯视觉模型就好比防空只用望远镜
版主: lexian
#1 FSD的纯视觉模型就好比防空只用望远镜
拟人化不是让你去放大人的弱点,视觉本来只有近程管用,人类为了克服这种弱点发展出肌肉记忆和潜意识来提高反应速度。elon倒好明明有lidar这种神器不用,为了省几个铜板每天忽悠你纯视觉比人开车还安全。你就说缺德不缺德
x1
x1


If printing money would end poverty, printing diplomas would end stupidity.
#3 Re: FSD的纯视觉模型就好比防空只用望远镜
我以前也反驳过了。
所谓“人开车就是靠两只眼睛,所以自动驾驶也只需要摄像头”,那要是按照这个逻辑:
汽车为什么需要四个轮子,不是猎豹一样四条强壮的腿?
飞机为什么需要固定翼和涡轮发动机,不是扑腾两个翅膀?
轮船为什么不使用鱼一样摆来摆去的尾巴?
所谓“人开车就是靠两只眼睛,所以自动驾驶也只需要摄像头”,那要是按照这个逻辑:
汽车为什么需要四个轮子,不是猎豹一样四条强壮的腿?
飞机为什么需要固定翼和涡轮发动机,不是扑腾两个翅膀?
轮船为什么不使用鱼一样摆来摆去的尾巴?
#4 Re: FSD的纯视觉模型就好比防空只用望远镜
飞机用固定翼这个,我是研究过的。鸟类的扑翼飞行其实空气动力学比飞机的固定翼要复杂得多,目前人类还没有能够完美解释扑翼飞行的空气动力学。但是问题是如果飞机用扑翼飞行方式的话机体在空中就会上下乱跳,坐飞机的人难受死。而且扑翼是飞不快的,固定翼才能实现亚音速超音速什么的。almostcalm 写了: 2025年 7月 20日 22:08 我以前也反驳过了。
所谓“人开车就是靠两只眼睛,所以自动驾驶也只需要摄像头”,那要是按照这个逻辑:
汽车为什么需要四个轮子,不是猎豹一样四条强壮的腿?
飞机为什么需要固定翼和涡轮发动机,不是扑腾两个翅膀?
轮船为什么不使用鱼一样摆来摆去的尾巴?
#5 Re: FSD的纯视觉模型就好比防空只用望远镜
因为鸟小 飞机大geniushanbiao 写了: 2025年 7月 20日 22:21 飞机用固定翼这个,我是研究过的。鸟类的扑翼飞行其实空气动力学比飞机的固定翼要复杂得多,目前人类还没有能够完美解释扑翼飞行的空气动力学。但是问题是如果飞机用扑翼飞行方式的话机体在空中就会上下乱跳,坐飞机的人难受死。而且扑翼是飞不快的,固定翼才能实现亚音速超音速什么的。
在鸟这种尺度 空气的粘性力 不可忽视,起的作用非常大
所以你看到越小的飞行生物 比如 苍蝇蚊子 那个扇动的频率更高,类似划水。
更大的飞行生物,比如信天翁,其实 翅膀不怎么扇动 就是类似平直机翼
x1

#7 Re: FSD的纯视觉模型就好比防空只用望远镜
最好的类比是 FSD 是近视眼,再怎么模式识别,远处的还是看不到,距离没法判断。
好比各位不戴眼镜就去开车,模模糊糊的瞎摸索可能也能开,就是出事了都不知道怎么挂的
好比各位不戴眼镜就去开车,模模糊糊的瞎摸索可能也能开,就是出事了都不知道怎么挂的
x1
x1


#8 Re: FSD的纯视觉模型就好比防空只用望远镜
人开车工作方式是双眼看远处,判断是否有危险信号,根据危险及时调整车速
刷题的AI根本做不了这个,不会判断啥是危险,只会刷题,看是不是在曾经的刷题记录里
这样的开车方法,很容易出事情
刷题的AI根本做不了这个,不会判断啥是危险,只会刷题,看是不是在曾经的刷题记录里
这样的开车方法,很容易出事情
#9 Re: FSD的纯视觉模型就好比防空只用望远镜
螞蟻龍就是要省錢
☆ 发自新买提 Android 25.07.07赖美豪中 写了: 2025年 7月 20日 21:02 拟人化不是让你去放大人的弱点,视觉本来只有近程管用,人类为了克服这种弱点发展出肌肉记忆和潜意识来提高反应速度。elon倒好明明有lidar这种神器不用,为了省几个铜板每天忽悠你纯视觉比人开车还安全。你就说缺德不缺德
搬砖叔
#10 Re: FSD的纯视觉模型就好比防空只用望远镜
你可能不知道,主流的机载对空导弹,过去的大半个世纪就是用的视觉(红外线),雷达制导的远距离对空导弹真正能用也是最近几年的事。赖美豪中 写了: 2025年 7月 20日 21:02 拟人化不是让你去放大人的弱点,视觉本来只有近程管用,人类为了克服这种弱点发展出肌肉记忆和潜意识来提高反应速度。elon倒好明明有lidar这种神器不用,为了省几个铜板每天忽悠你纯视觉比人开车还安全。你就说缺德不缺德
红外导弹,从第一代的响尾蛇2个像素,到现在的AIM-9x的128*128像素,这么瞎的视觉,近距离就是比雷达准确可靠。最近20年的战机(比如F35),都装了IRST,红外搜索跟踪系统,近距离比雷达更好。
lidar不能单独工作,只能和摄像头一起工作,它看不了信号灯,看不见行道线,也看不懂路牌。作为摄像头的的搭档,它并不合格,应为它提供不了什么摄像头得不到的信息,因为纯视觉是可以通过深度信息对周围3d建模的。lidar不是雷达,它扫出去的是有限数量的窄激光beam,而不是雷达波,视觉看不到的,它一样看不到,雨、雪、雾天照样不工作。
现在方向是 视觉+4D HD image radar,4d 高清成像雷达是雷达波,不是激光束,它有很强的穿透和衍射能力, 更远的探测距离,和更低成本。它是视觉的很好互补,而lidar现在看来是自动驾驶技术发展史上的阑尾
#11 Re: FSD的纯视觉模型就好比防空只用望远镜
问题是导弹不怕出错,人家都是对付一架飞机发射好几枚导弹,只要能命中一枚就是成功拦截。自动驾驶正好相反,你车上的系统就这一个,出一个错就能造成事故。你敢用么?victor 写了: 昨天 17:56 你可能不知道,主流的机载对空导弹,过去的大半个世纪就是用的视觉(红外线),雷达制导的远距离对空导弹真正能用也是最近几年的事。
红外导弹,从第一代的响尾蛇2个像素,到现在的AIM-9x的128*128像素,这么瞎的视觉,近距离就是比雷达准确可靠。最近20年的战机(比如F35),都装了IRST,红外搜索跟踪系统,近距离比雷达更好。
lidar不能单独工作,只能和摄像头一起工作,它看不了信号灯,看不见行道线,也看不懂路牌。作为摄像头的的搭档,它并不合格,应为它提供不了什么摄像头得不到的信息,因为纯视觉是可以通过深度信息对周围3d建模的。lidar不是雷达,它扫出去的是有限数量的窄激光beam,而不是雷达波,视觉看不到的,它一样看不到,雨、雪、雾天照样不工作。
现在方向是 视觉+4D HD image radar,4d 高清成像雷达是雷达波,不是激光束,它有很强的穿透和衍射能力, 更远的探测距离,和更低成本。它是视觉的很好互补,而lidar现在看来是自动驾驶技术发展史上的阑尾
x1

#12 Re: FSD的纯视觉模型就好比防空只用望远镜
我认为FSD应该是鸟与蝙蝠的hybrid,Elon还没有这种概念赖美豪中 写了: 2025年 7月 20日 21:02 拟人化不是让你去放大人的弱点,视觉本来只有近程管用,人类为了克服这种弱点发展出肌肉记忆和潜意识来提高反应速度。elon倒好明明有lidar这种神器不用,为了省几个铜板每天忽悠你纯视觉比人开车还安全。你就说缺德不缺德
#13 Re: FSD的纯视觉模型就好比防空只用望远镜
纯视觉哪里有远距离的深度信息来建模?
LiDAR 就是提供远距离测量的。
再说用 LiDAR 一样也用摄像头,来补充色彩线条信息
毫米波雷达的波束精度根本不够,而且受地面杂波干扰严重。
LiDAR 就是提供远距离测量的。
再说用 LiDAR 一样也用摄像头,来补充色彩线条信息
毫米波雷达的波束精度根本不够,而且受地面杂波干扰严重。
victor 写了: 昨天 17:56 你可能不知道,主流的机载对空导弹,过去的大半个世纪就是用的视觉(红外线),雷达制导的远距离对空导弹真正能用也是最近几年的事。
红外导弹,从第一代的响尾蛇2个像素,到现在的AIM-9x的128*128像素,这么瞎的视觉,近距离就是比雷达准确可靠。最近20年的战机(比如F35),都装了IRST,红外搜索跟踪系统,近距离比雷达更好。
lidar不能单独工作,只能和摄像头一起工作,它看不了信号灯,看不见行道线,也看不懂路牌。作为摄像头的的搭档,它并不合格,应为它提供不了什么摄像头得不到的信息,因为纯视觉是可以通过深度信息对周围3d建模的。lidar不是雷达,它扫出去的是有限数量的窄激光beam,而不是雷达波,视觉看不到的,它一样看不到,雨、雪、雾天照样不工作。
现在方向是 视觉+4D HD image radar,4d 高清成像雷达是雷达波,不是激光束,它有很强的穿透和衍射能力, 更远的探测距离,和更低成本。它是视觉的很好互补,而lidar现在看来是自动驾驶技术发展史上的阑尾
x1

#14 Re: FSD的纯视觉模型就好比防空只用望远镜
就好比那个FSD撞了旧轮胎,擦坏了底盘的。应该是第一时间看到,就要估计轮胎有多高
能不能触碰底盘,要不要躲开,其次是分辨是活物还是死的,有没有速度,有速度是加速
减速,再次是分析一下是个什么东西,硬度是多少。如果计算不能躲开,是不是压过去
更好一些,至少底盘不会损失,会不会翻车,车速应该是多少,左边撞好还是右边撞好
能不能触碰底盘,要不要躲开,其次是分辨是活物还是死的,有没有速度,有速度是加速
减速,再次是分析一下是个什么东西,硬度是多少。如果计算不能躲开,是不是压过去
更好一些,至少底盘不会损失,会不会翻车,车速应该是多少,左边撞好还是右边撞好
#19 Re: FSD的纯视觉模型就好比防空只用望远镜
tesla里那个phoniex就是个4d imaging radar,它得工作频率比比一般的毫米波雷达高一些,内部是由几十个单元组成的阵列,类似战斗机上的相控阵雷达。传统的mmWave雷达的精度最好也就10cm+,4d成像雷达精度能达到3-4cm,连人的profile都能扫出来, 抗干扰能力也更好。
这个精度虽然比lidar差了点,但作为视觉的拐杖,是完全够用了,它最大的优点是穿透和衍射能力强,别说雨雪雾天没有问题,甚至有些躲在物体后盲区里的东西都可以看到。而lidar就完全不行了,你视觉看不到它也看不到。
4d成像雷达还有个优点就是便宜,体积小,据说200-300美元就能买到,没有moving parts,可靠。waymo车顶上哪种不停转的lidar,既贵又容易坏。
4d成像雷达的优缺点和视觉成像基本是完全互补的,是视觉方案的绝佳拐杖和拍档
x1
