现在说ai是骗子的都是骗子
版主: hci
#2 Re: 现在说ai是骗子的都是骗子
Fake it till you make it
There are two ways to conquer and enslave a country. One is by the sword. The other is by debt. - John Adams
#5 Re: 现在说ai是骗子的都是骗子
觉得自己能标新立异唄。调几个api,没训过模型,连eval dataset都没搞过,找到几个不work的例子就出来大喊“我就说AI不行吧”。现在不用AI还可以活,过几年不得不用AI的时候,大部分这种人可能就消停了,剩下些最嘴硬的。
x1

#7 Re: 现在说ai是骗子的都是骗子
你用AI写过代码,或者修改现成的屎山么?你用的哪套系统,什么语言,效果如何?
我尝试过copilot和cursor,在修改现成的屎山任务上面,一个是灾难,另一个是鸡肋。
训练模型肯定需要技术和经验,但是作为一个编程工具来使用AI,我觉得还是没有那么高的门槛。在AI真正好用以前做个early adoper的用户意义不大。
我尝试过copilot和cursor,在修改现成的屎山任务上面,一个是灾难,另一个是鸡肋。
训练模型肯定需要技术和经验,但是作为一个编程工具来使用AI,我觉得还是没有那么高的门槛。在AI真正好用以前做个early adoper的用户意义不大。
fantasist 写了: 2025年 7月 16日 11:41 觉得自己能标新立异唄。调几个api,没训过模型,连eval dataset都没搞过,找到几个不work的例子就出来大喊“我就说AI不行吧”。现在不用AI还可以活,过几年不得不用AI的时候,大部分这种人可能就消停了,剩下些最嘴硬的。
#8 Re: 现在说ai是骗子的都是骗子
我现在搞training framework,基本全是python。AI帮忙解释vllm项目之类的屎山代码逻辑还是很有帮助的,比肉眼看逻辑和查文档快很多。因为我做的training infra scale比较大,还涉及到算法,没有开源项目实现过,也没几个大厂内部搞过,不可能有足够稳定、well documented训练数据,而且运行一次费时长,必须很小心。这方面让AI自己上手编写或修改然后运行这些代码肯定是不现实的,只能自己一点点试,所以不具有代表性。目前coding agent写个网站什么的因为有大量开源template,运行迭代也容易,这方面能力成熟多了。Havana 写了: 2025年 7月 16日 22:43 你用AI写过代码,或者修改现成的屎山么?你用的哪套系统,什么语言,效果如何?
我尝试过copilot和cursor,在修改现成的屎山任务上面,一个是灾难,另一个是鸡肋。
训练模型肯定需要技术和经验,但是作为一个编程工具来使用AI,我觉得还是没有那么高的门槛。在AI真正好用以前做个early adoper的用户意义不大。
#9 Re: 现在说ai是骗子的都是骗子
Vllm是inference framework还是training fw?fantasist 写了: 2025年 7月 17日 13:58 我现在搞training framework,基本全是python。AI帮忙解释vllm项目之类的屎山代码逻辑还是很有帮助的,比肉眼看逻辑和查文档快很多。因为我做的training infra scale比较大,还涉及到算法,没有开源项目实现过,也没几个大厂内部搞过,不可能有足够稳定、well documented训练数据,而且运行一次费时长,必须很小心。这方面让AI自己上手编写或修改然后运行这些代码肯定是不现实的,只能自己一点点试,所以不具有代表性。目前coding agent写个网站什么的因为有大量开源template,运行迭代也容易,这方面能力成熟多了。
-
- 著名点评
heteroclinic 的博客 - 帖子互动: 38
- 帖子: 3816
- 注册时间: 2022年 10月 31日 00:35
#12 Re: 现在说ai是骗子的都是骗子
这个板上谁跑过deepseek 的inference? 来吹吹?
我个人整三个星期(筹备机器两个月)左右把草台子搭起来.当然您有一键云CD,书就就跪求您plan了.
我个人整三个星期(筹备机器两个月)左右把草台子搭起来.当然您有一键云CD,书就就跪求您plan了.
上次由 heteroclinic 在 2025年 7月 17日 20:11 修改。
-
- 著名点评
heteroclinic 的博客 - 帖子互动: 38
- 帖子: 3816
- 注册时间: 2022年 10月 31日 00:35
#14 Re: 现在说ai是骗子的都是骗子
REheteroclinic 写了: 2025年 7月 17日 20:08 这个板上谁跑过deepseek 的inference? 来吹吹?
我个人整三个星期(筹备机器两个月)左右把草台子搭起来.当然您有一键云CD,书就就跪求您plan了.
-
- 著名点评
heteroclinic 的博客 - 帖子互动: 38
- 帖子: 3816
- 注册时间: 2022年 10月 31日 00:35
#15 Re: 现在说ai是骗子的都是骗子
在另外一个帖子提到时间事件关联
就涉及到一个概念叫可变性,就是物理规律会随时间变化而变化
比如赛马因为服用紧要被取消成绩而且具有回溯期. 禁药也可能随时间变化更新.
没有啥AI A不I,就是山头利益.
就涉及到一个概念叫可变性,就是物理规律会随时间变化而变化
比如赛马因为服用紧要被取消成绩而且具有回溯期. 禁药也可能随时间变化更新.
没有啥AI A不I,就是山头利益.
#16 Re: 现在说ai是骗子的都是骗子
fp8 checkpoint在H200x8机器上可以直接单机跑。当然我们是因为自己调了以后self host,你要直接用原版肯定直接调API方便。heteroclinic 写了: 2025年 7月 17日 20:08 这个板上谁跑过deepseek 的inference? 来吹吹?
我个人整三个星期(筹备机器两个月)左右把草台子搭起来.当然您有一键云CD,书就就跪求您plan了.
别的inference framework不清楚,vllm对dsv3的支持没问题,多node TP/PP都work out of the box。核心问题还是你为啥要self host,不能justify的话别搞这个。
+1.00 积分 [版主 hci 发放的奖励]
-
- 著名点评
heteroclinic 的博客 - 帖子互动: 38
- 帖子: 3816
- 注册时间: 2022年 10月 31日 00:35
#17 Re: 现在说ai是骗子的都是骗子
给个GITHUB倍,有点疑问,你单机跑,IP清单你怎么设置的. 可能就是你说的self host我没调明白.fantasist 写了: 2025年 7月 17日 20:30 fp8 checkpoint在H200x8机器上可以直接单机跑。当然我们是因为自己调了以后self host,你要直接用原版肯定直接调API方便。
最后意思下,能简单跑个什么东西,我忘了.
整个过程,每个计划都充满漏洞,尤其是你自己拼硬件.
H200x8云CD愿闻其翔
最后我说的是DEEPSEEK 72B tokens那个inference.消除一下歧义
-
- 著名点评
heteroclinic 的博客 - 帖子互动: 38
- 帖子: 3816
- 注册时间: 2022年 10月 31日 00:35
-
- 著名点评
heteroclinic 的博客 - 帖子互动: 38
- 帖子: 3816
- 注册时间: 2022年 10月 31日 00:35
#19 Re: 现在说ai是骗子的都是骗子
你老LOL是Deepseek的老板么,有点不太严肃.let's say, we 假装闷儿 你毕业答辩. I suppose you won't cheat and lie under pressure.
#20 Re: 现在说ai是骗子的都是骗子
认真搞post-train的没个千卡H100之类的都是在玩屁吃,pre-train更是万卡起步,硬件门槛太高。大部分人根本没机会接触真正的模型训练,很多phd也只能拿个8b llama训练刷benchmark。只能用别人装好的AI产品,或者调API做点prompt engineering,或者拿langchain之流搭RAG产品,发现不work没有能力自己干模型于是没办法解决,然后开始说AI是骗局,实属情有可原。模型参数从几B到几十B到几百B,智能的差别是巨大的。kimi-k2搞了个超过1T的开源大模型,我们做ai infra的看了直吐血。T级别的模型能玩转的,世界上确实没多少人,所以小扎掏100米砸那些实力已经有证明的专家,我们公司没钱所以想招个懂的newgrad phd都费劲。
x2

上次由 fantasist 在 2025年 7月 17日 20:48 修改。