分页: 3 / 4

#42 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 14:33
hci

好主意,可以开个这样的公司。

wildthing 写了: 2025年 8月 14日 14:15

或者开发这类的服务平台如何?
平台可以提供一些训练的一条龙服务。本身不直接接触数据。利用Trusted computing environment


#43 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 14:38
pnlmpnlm

前面不少人问了你没钱怎么和别人拼之类的。其实我读你写的也有类似的感觉。

这么说吧,当初NLP刚🔥起来的时候多少小公司什么data monster之类的各路也都火了那么一小会。然后人家巨头一个大模型出来直接全死了。
同样的问题也对你们公司,你们就算再怎么有情怀,中间有没有绝对的天才?没有绝对的天才凭借你们的资源,能干的过Anthropic么?人家下一代模型一个爆发是不是很可能直接就把你们的赛道灭了。短频快的针对不同公司的垂直小模型针对别人公司具体数据开发对应的适合客户应用(也就是你看不起的微调,RAG,agent)的可能更现实一些。
你说了很多,但是在我眼里看,有点航空领域类似2流科学家还不甘心希望有机会用很少的钱找机会做出来比GE比SpaceX更好的发动机的感觉。
尤其问题是AI的这条路上是一家独大的风格,非顶流的是应该继续自己的梦还是应该放下架子多听市场的声音,我想大多数人还是会选择后者,多去了解客户的需要的不是你能做什么模型,客户需要的是简洁易懂适合自己的东西。


#44 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 14:59
fantasist
pnlmpnlm 写了: 2025年 8月 14日 14:38

前面不少人问了你没钱怎么和别人拼之类的。其实我读你写的也有类似的感觉。

这么说吧,当初NLP刚🔥起来的时候多少小公司什么data monster之类的各路也都火了那么一小会。然后人家巨头一个大模型出来直接全死了。
同样的问题也对你们公司,你们就算再怎么有情怀,中间有没有绝对的天才?没有绝对的天才凭借你们的资源,能干的过Anthropic么?人家下一代模型一个爆发是不是很可能直接就把你们的赛道灭了。短频快的针对不同公司的垂直小模型针对别人公司具体数据开发对应的适合客户应用(也就是你看不起的微调,RAG,agent)的可能更现实一些。
你说了很多,但是在我眼里看,有点航空领域类似2流科学家还不甘心希望有机会用很少的钱找机会做出来比GE比SpaceX更好的发动机的感觉。
尤其问题是AI的这条路上是一家独大的风格,非顶流的是应该继续自己的梦还是应该放下架子多听市场的声音,我想大多数人还是会选择后者,多去了解客户的需要的不是你能做什么模型,客户需要的是简洁易懂适合自己的东西。

我们当然要靠产品,不是直接跟模型巨头竞争。但对自有模型的要求比较高,目标是在相对general的范围beat frontier model然后降低成本,不能像niche垂类一样拿小模型专攻一小块能力,所以对训练的投入比较大。这两种work其实挺不一样的,垂类微调主要是给模型注入domain knowledge,拿小模型省成本,效果不好也只能听天由命;而我们做的是用各种手段提高最强的开源模型在某类任务上的能力。“人家下一代模型一个爆发是不是很可能直接就把你们的赛道灭了”,如果AGI实现了确实有可能,如果只是gpt5这样的迭代那肯定不会。现在startup不傻,不会做chegg/stackoverflow一样的产品,模型基本的输出就能取而代之,都是要靠完整的系统打出竞争优势。
GenAI产品不是空中楼阁,做frontend/backend/infra的人不可或缺。我自己搞infra出身,见多了做脏活累活也没credit的问题,所以最近的帖子主要讨论同样是搬砖,怎么根据市场趋势最大化自己的价值。我不是看不起的微调、RAG,这些也是干实事的,只要别号称AI专家就好,最重要的问题是搞这些挣不到钱,市场供给太多。meta为什么要给牛人发很多钱,除了那些人牛,另一方面是稀缺性而且价值高。如果有机会当然要去做这种稀缺且价值高的事情,普通人能冲一下一年几个米的机会已经很不错了,如果只图看的见几百k的活,不如就在大厂混。


#45 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 16:34
magagop
fantasist 写了: 2025年 8月 14日 14:59

我们当然要靠产品,不是直接跟模型巨头竞争。但对自有模型的要求比较高,目标是在相对general的范围beat frontier model然后降低成本,不能像niche垂类一样拿小模型专攻一小块能力,所以对训练的投入比较大。这两种work其实挺不一样的,垂类微调主要是给模型注入domain knowledge,拿小模型省成本,效果不好也只能听天由命;而我们做的是用各种手段提高最强的开源模型在某类任务上的能力。“人家下一代模型一个爆发是不是很可能直接就把你们的赛道灭了”,如果AGI实现了确实有可能,如果只是gpt5这样的迭代那肯定不会。现在startup不傻,不会做chegg/stackoverflow一样的产品,模型基本的输出就能取而代之,都是要靠完整的系统打出竞争优势。
GenAI产品不是空中楼阁,做frontend/backend/infra的人不可或缺。我自己搞infra出身,见多了做脏活累活也没credit的问题,所以最近的帖子主要讨论同样是搬砖,怎么根据市场趋势最大化自己的价值。我不是看不起的微调、RAG,这些也是干实事的,只要别号称AI专家就好,最重要的问题是搞这些挣不到钱,市场供给太多。meta为什么要给牛人发很多钱,除了那些人牛,另一方面是稀缺性而且价值高。如果有机会当然要去做这种稀缺且价值高的事情,普通人能冲一下一年几个米的机会已经很不错了,如果只图看的见几百k的活,不如就在大厂混。

我覺得你的要求都很準確,但不適合初創公司。因為初創公司技術不是最重要的,人員穩定才是最重要的,所謂「打仗兄弟營上陣父子兵」是也,不能創業創成仇人。越是牛人,你越無法降伏,很容易造成「火併王倫」的下場。技術差可以培養,人心散了,技術再強也是敵人。團隊裡面都是孫悟空,那只能上演真假孫行者的戲碼。


#46 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 16:51
pnlmpnlm
fantasist 写了: 2025年 8月 14日 14:59

我们当然要靠产品,不是直接跟模型巨头竞争。但对自有模型的要求比较高,目标是在相对general的范围beat frontier model然后降低成本,不能像niche垂类一样拿小模型专攻一小块能力,所以对训练的投入比较大。“人家下一代模型一个爆发是不是很可能直接就把你们的赛道灭了”,如果AGI实现了那确实有可能,如果只是gpt5这样的迭代那暂时不会。现在startup不傻,不会做chegg一样的产品,模型基本的输出就能取而代之,都是要靠完整的系统打出竞争优势。
GenAI产品不是空中楼阁,做frontend/backend/infra的人不可或缺。我自己搞infra出身,见多了做脏活累活也没credit的问题,所以最近的帖子主要讨论同样是搬砖,怎么根据市场趋势最大化自己的价值。

反正看不懂也不知道你们干什么,我也不是什么AI researcher;在我看来连mistral,cohere这类公司能不能活都是问题。我只知道我关心的领域见过几个公司兴致勃勃的在搞time series foundation model。从我的角度看,就是死路一条。虽然我司也在跟着开穷嗖嗖的50万/年的cash +股票找这方面的人,反正我认为我们这边就是瞎扯,所谓自己general行业的优势很可能其实只是数据有一点点优势,因为这点所谓“大”模型的优势真的应用到具体的客户自己有具体的数据上,可能还不如客户自己的人用gemini之类的大模型具体的指点自己的人做点针对自己公司的更好。你们的看不懂因为我也不是什么真懂gen AI的人,听你说的好像高大上一点,但是至少让我在自己的行业上,我没觉得使用这些顶尖大模型配合自己的简单知识针对性的开发有什么不好的。


#47 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 17:32
fantasist
pnlmpnlm 写了: 2025年 8月 14日 16:51

反正看不懂也不知道你们干什么,我也不是什么AI researcher;在我看来连mistral,cohere这类公司能不能活都是问题。我只知道我关心的领域见过几个公司兴致勃勃的在搞time series foundation model。从我的角度看,就是死路一条。虽然我司也在跟着开穷嗖嗖的50万/年的cash +股票找这方面的人,反正我认为我们这边就是瞎扯,所谓自己general行业的优势很可能其实只是数据有一点点优势,因为这点所谓“大”模型的优势真的应用到具体的客户自己有具体的数据上,可能还不如客户自己的人用gemini之类的大模型具体的指点自己的人做点针对自己公司的更好。你们的看不懂因为我也不是什么真懂gen AI的人,听你说的好像高大上一点,但是至少让我在自己的行业上,我没觉得使用这些顶尖大模型配合自己的简单知识针对性的开发有什么不好的。

我上一家公司做pretrain,感觉更有意思,跟牛人同事们学到很多,可惜钱烧完就黄了。现在的公司知道不可能直接跟御三家竞争,不碰pretrain,专心搞产品。pretrain确实太难,需要万卡起步是一大门槛,欧美这边mistral/cohere的牛人估计都跑光了,所以越做越差。墙国的几个厂有厉害的人才,所以现在最强的几个开源模型都是墙国的。以前合作过的一些水平相当不错,但不愿意出国,不然搬几个过来能解决很多问题。

"所谓“大”模型的优势真的应用到具体的客户自己有具体的数据上,可能还不如客户自己的人用gemini之类的大模型具体的指点自己的人做点针对自己公司的更好" 这个就是我不考虑去做微调、RAG的公司的原因。训练水平跟不上,折腾半天llama 8b,说不定还不如直接想好prompt直接调用frontier model的API,纯粹在浪费时间。这类公司business的基础是一些domain knowledge,有没有AI都能生存下去。而且上限很低,不然巨头早过来抢食了。比如generative search / coding agent之类的市场前景大,巨头就直接下场拼杀,原本搞这些的小startup只能另寻出路。像OA的大包或meta这种砸钱挖人的方法,如果真看中了某个垂类,直接买点数据拉几个核心人员就搞起来了,所以这类小公司的护城河主要在于赛道上人少,而不是AI能力。去这样的公司做AI产品,无法给个人带来溢价,只适合对这个domain感兴趣的人。
我也不是researcher,之前没搞过大模型训练的时候拿到几个server和llm endpoint,几个月就写出一堆RAG和application backend。谁都能轻易入门的东西必然是红海,所以我看出做这个不靠谱,赶紧往训练方面靠,不是说做的东西高大上,而是市场需求大于供给,稀缺性不会很快填平。


#48 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 18:20
Bluesky
wildthing 写了: 2025年 8月 14日 09:07

好像一句话就是只招实战过大模型的人。所以新手一概完蛋。你们这样无法找齐deepseek这样的团队啊。

成龙最近说了为啥现在电影比以前的差,是因为现在都怕失败。所以只敢做些衍生的产品。llm也要陷入这个怪圈了

思路是对的,“只招爬过珠峰的登山运动员,”但你这是和小札抢人啊,怎么抢得过?


#49 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 18:21
Bluesky
赖美豪中 写了: 2025年 8月 14日 09:12

我来给你总结以下,没钱还要买88克拉,你们这种要求的话小札都要,人家开出来的是2亿包裹,你打算开出来多少,20万?剩下都靠情怀?

哈哈,太准确了。。。


#50 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 18:23
Hercubic

说的很好,但满足你条件的人,现在老值钱了,到处都在找能帮AI落地的人才


#51 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 18:27
Bluesky
longtian 写了: 2025年 8月 14日 13:02

你直接去应聘meta或者找人把你们买了不就完事了

我开始也是这么想,楼主不如去应聘当小札的面试官,不过估计过不了。


#52 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 18:27
cangyoujiacuo
laoxg 写了: 2025年 8月 14日 14:05

呵呵,你知道对很多人而言,他们的所谓“work/life/LC management”,就是本职工作不好好干,利用上班时间偷偷刷题吧?这种人你司想招吗?

这个世界心猿意马的聪明人太多了,其中的大部分人刷来刷去就是为了一个好饭碗,其实挺可惜的。不过讲真,这是性价比最高的路径,聪明人不旺被称为聪明人。

聪明不聪明,最客观的标准就是成王败寇。创业太难,只要在市场上,自己能靠自己活下去,就比打工已经高了一个段位了,就是聪明人。


#53 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 18:40
Bluesky

小公司,自己又没有绝活的,没有天顶星人来帮忙的,只能夹缝中求生存,找一些大公司看不上眼的活计来干。既要有要还要的想法要不得。如果真是为了情怀,一定要站到这个领域的最前端去看风景,那么当大学教授或许是个不错的选择。如果又有多余精力,利用自己的最前端知识开个小公司,或去给头部公司当个顾问,指点一下江山。


#54 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 18:41
fantasist
Bluesky 写了: 2025年 8月 14日 18:27

我开始也是这么想,楼主不如去应聘当小札的面试官,不过估计过不了。

我要有那种水平,忙着数钱都来不及,还来这个版上干啥


#55 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 18:46
Bluesky
fantasist 写了: 2025年 8月 14日 18:41

我要有那种水平,忙着数钱都来不及,还来这个版上干啥

其实当伯乐更难。


#56 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 18:48
fantasist
Bluesky 写了: 2025年 8月 14日 18:40

小公司,自己又没有绝活的,没有天顶星人来帮忙的,只能夹缝中求生存,找一些大公司看不上眼的活计来干。既要有要还要的想法要不得。

其实回帖大多都跑题了。我想说的是top researcher之下,对于普通人来说什么样的技能最稀缺,能赚到这波风口的溢价。我们公司有没有前途不是重点,自有founder们去烦恼的事。想办法提升自己,get paid to learn最重要。


#57 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 19:10
supercnm
CNM01 写了: 2025年 8月 14日 09:27

笑死人,现在几百B参数的大模型一共也没几个吧,训过那些模型的人名单都在小札心理装着呢,小札搞不定的人,你肯定也搞不定

同意
而且我觉得大模型可能快到极限了,剩下10%的性能,可能要花数倍于之前90%性能的投入,费效比太高,大公司都不一定撑得住


#58 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 19:11
Bluesky

“能赚到这波风口的溢价”, 换个思路,挖不到金子可以卖铲子嘛。


#59 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 19:12
Bluesky
supercnm 写了: 2025年 8月 14日 19:10

同意
而且我觉得大模型可能快到极限了,剩下10%的性能,可能要花数倍于之前90%性能的投入,费效比太高,大公司都不一定撑得住

就和当年挖比特币一样?挖到后来不合算了。电费比比特币都贵。


#60 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 19:13
Bluesky

我在想,皮衣黄是不是就是那个卖铲子的。。。。。


#61 Re: 如何招到真懂GenAI的人

发表于 : 2025年 8月 14日 21:26
pplar

仔细地读了每个帖子,都很有道理。