分页: 1 / 1

#1 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 18日 01:55
fantasist
本来想写一篇,发现朋友做了一期视频,大方向上讲的挺好,直接看吧。


看起来他们公司老板跑路后算法层面没什么大牛,对于pre-train/post-train research work不太了解。我认为coding强的码工只要下苦功,转行成researcher还是很有希望的。比如pre-train和post-train都需要数据,有很强文字等数据处理经验的码工完全可以搞一搞。infra层面,比如最近kimi-k2对muon optimizer的改进,就是通过各种实验想办法增强计算的numerical stability,其中占很大比例的搬砖的活我觉得普通程序员只要去做就有机会胜任。
最大的难点还是怎么去找到相关的工作。pre-train的厂家屈指可数,做出过能拿的出手的foundation model,确实都是世界上最顶尖的AI人才,经验积累不强的人往上靠的机会非常渺茫。而投入大量资源的做post-train的其实很少,不是视频里说的大多数公司都在(能)做。我比较了解的一些有一定资金实力的中厂,比如roblox和service now,想做post-train但都没多少卡,当然吸引不到好的researcher也不太可能做出厉害的成果。从实际的角度出发,选合适的AI公司去搞偏产品的backend和frontend比较容易,相应的基本没有溢价,主要是也许能找到机会再往AI顶层靠。

#2 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 18日 02:09
Whyisthis
就怕换跑道转行,哼哧哼哧学几年,大模型这把火烧过了不再流行了。

#3 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 18日 11:53
hahan
Engineering 的东西谁都能做
大一的知识储备足矣
问题是phd都一大堆供远大于求
连生物phd现在都转ai
谁会找普通swe呢

#4 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 18日 12:07
magagop
fantasist 写了: 2025年 7月 18日 01:55 本来想写一篇,发现朋友做了一期视频,大方向上讲的挺好,直接看吧。


看起来他们公司老板跑路后算法层面没什么大牛,对于pre-train/post-train research work不太了解。我认为coding强的码工只要下苦功,转行成researcher还是很有希望的。比如pre-train和post-train都需要数据,有很强文字等数据处理经验的码工完全可以搞一搞。infra层面,比如最近kimi-k2对muon optimizer的改进,就是通过各种实验想办法增强计算的numerical stability,其中占很大比例的搬砖的活我觉得普通程序员只要去做就有机会胜任。
最大的难点还是怎么去找到相关的工作。pre-train的厂家屈指可数,做出过能拿的出手的foundation model,确实都是世界上最顶尖的AI人才,经验积累不强的人往上靠的机会非常渺茫。而投入大量资源的做post-train的其实很少,不是视频里说的大多数公司都在(能)做。我比较了解的一些有一定资金实力的中厂,比如roblox和service now,想做post-train但都没多少卡,当然吸引不到好的researcher也不太可能做出厉害的成果。从实际的角度出发,选合适的AI公司去搞偏产品的backend和frontend比较容易,相应的基本没有溢价,主要是也许能找到机会再往AI顶层靠。
這個視頻完全沒有講AI加速器芯片和GPU芯片,那也是一個方向,不一定非要做LLM模型的才是AI,做芯片的當然也是AI。模型越來越大,最關鍵的瓶頸是硬件芯片,不是模型專家。

#5 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 18日 12:08
magagop
hahan 写了: 2025年 7月 18日 11:53 Engineering 的东西谁都能做
大一的知识储备足矣
问题是phd都一大堆供远大于求
连生物phd现在都转ai
谁会找普通swe呢
大一知識儲備不能做AI芯片,生物PhD也不能轉AI芯片方向

#6 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 18日 12:15
fantasist
hahan 写了: 2025年 7月 18日 11:53 Engineering 的东西谁都能做
大一的知识储备足矣
问题是phd都一大堆供远大于求
连生物phd现在都转ai
谁会找普通swe呢
天上不会掉馅饼,机会是要自己去争取的。学校里的phd算法方面再怎么强,engineering方面肯定没industry SWE多,各有优势。

#7 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 18日 12:19
fantasist
magagop 写了: 2025年 7月 18日 12:07 這個視頻完全沒有講AI加速器芯片和GPU芯片,那也是一個方向,不一定非要做LLM模型的才是AI,做芯片的當然也是AI。模型越來越大,最關鍵的瓶頸是硬件芯片,不是模型專家。
硬件工程师在硅谷包裹一般是SWE的一半,没人会往这方向转吧,除非搞AI芯片能发大包。据我所知nvidia和amd做AI硬件的base和equity都很少(不算nvidia股价涨幅)。
写CUDA kernel之类的应该算AI infra,在inference stack里应用广泛,也是一条之前没细讲的出路,这个其实挺适合Infra SWE。

#8 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 18日 13:08
magagop
fantasist 写了: 2025年 7月 18日 12:19 硬件工程师在硅谷包裹一般是SWE的一半,没人会往这方向转吧,除非搞AI芯片能发大包。据我所知nvidia和amd做AI硬件的base和equity都很少(不算nvidia股价涨幅)。
写CUDA kernel之类的应该算AI infra,在inference stack里应用广泛,也是一条之前没细讲的出路,这个其实挺适合Infra SWE。
芯片好處是通用,AI不行了,還有別的,也沒人過來卷。

#9 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 18日 21:08
hahan
fantasist 写了: 2025年 7月 18日 01:55 本来想写一篇,发现朋友做了一期视频,大方向上讲的挺好,直接看吧。


看起来他们公司老板跑路后算法层面没什么大牛,对于pre-train/post-train research work不太了解。我认为coding强的码工只要下苦功,转行成researcher还是很有希望的。比如pre-train和post-train都需要数据,有很强文字等数据处理经验的码工完全可以搞一搞。infra层面,比如最近kimi-k2对muon optimizer的改进,就是通过各种实验想办法增强计算的numerical stability,其中占很大比例的搬砖的活我觉得普通程序员只要去做就有机会胜任。
最大的难点还是怎么去找到相关的工作。pre-train的厂家屈指可数,做出过能拿的出手的foundation model,确实都是世界上最顶尖的AI人才,经验积累不强的人往上靠的机会非常渺茫。而投入大量资源的做post-train的其实很少,不是视频里说的大多数公司都在(能)做。我比较了解的一些有一定资金实力的中厂,比如roblox和service now,想做post-train但都没多少卡,当然吸引不到好的researcher也不太可能做出厉害的成果。从实际的角度出发,选合适的AI公司去搞偏产品的backend和frontend比较容易,相应的基本没有溢价,主要是也许能找到机会再往AI顶层靠。
这是你朋友
看了下频道节目
No offense
精致利己小市民气到disgusting 的程度

#10 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 18日 22:56
fantasist
hahan 写了: 2025年 7月 18日 21:08 这是你朋友
看了下频道节目
No offense
精致利己小市民气到disgusting 的程度
这世界不利己就干到60岁还在搬砖,找高回报的work有啥可指摘的?newgrad不想明白这些也没人指点的话,很可能一晃十年过去成为老黄牛,大好青春都浪费了。

#11 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 19日 06:19
wass
hahan 写了: 2025年 7月 18日 11:53 Engineering 的东西谁都能做
大一的知识储备足矣
问题是phd都一大堆供远大于求
连生物phd现在都转ai
谁会找普通swe呢
open ai为了解决这个问题,把researcher和swe都叫tech Staff

#12 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 19日 06:21
wass
看看DeepSeek的进步,多数属于se

#13 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 19日 06:41
Bluesky
magagop 写了: 2025年 7月 18日 12:07 這個視頻完全沒有講AI加速器芯片和GPU芯片,那也是一個方向,不一定非要做LLM模型的才是AI,做芯片的當然也是AI。模型越來越大,最關鍵的瓶頸是硬件芯片,不是模型專家。
芯片不是谁都能做,起码得懂半导体集成电路基本知识,加上还得穿大白下工厂超净室。秀才们能吃得了这种苦?现在的AI和当年的稻糠母泡沫一样,只不过是换了层皮的庞氏骗局。里面有金子(就如当年泡沫里还是有移动通讯这块有价值的部分),但远不如吹的。

#14 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 19日 06:43
Bluesky
当年大学里学历史的,学教育的,学电影的,都一股脑扎堆计算机科学系。。。。it挣钱嘛

#15 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 20日 02:15
backender
hahan 写了: 2025年 7月 18日 21:08 这是你朋友
看了下频道节目
No offense
精致利己小市民气到disgusting 的程度
我看了一下,没有发现你说的。
精致利己在哪?

#16 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 20日 02:31
fantasist
backender 写了: 昨天 02:15 我看了一下,没有发现你说的。
精致利己在哪?
可能他对向上管理之类的词过于敏感。他们的一系列视频从不教人怎么sabotage同事,而是从各种角度说怎么求同存异与上下级和peer合作,如何deliver项目给公司创造价值的同时,发展自己的leadership以及保证个人利益。people skills其实很多在厂里混的不如意的人非常需要学习。

#17 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 20日 02:33
backender
fantasist 写了: 昨天 02:31 可能他对向上管理之类的词过于敏感。他们的一系列视频从不教人怎么sabotage同事,而是从各种角度说怎么求同存异与上下级和peer合作,如何deliver项目给公司创造价值的同时,发展自己的leadership以及保证个人利益。people skills其实很多在厂里混的不如意的人非常需要学习。

没发现什么问题
就是长得比较丑

#18 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 20日 06:30
newIdRobot
Bluesky 写了: 2025年 7月 19日 06:41 芯片不是谁都能做,起码得懂半导体集成电路基本知识,加上还得穿大白下工厂超净室。秀才们能吃得了这种苦?现在的AI和当年的稻糠母泡沫一样,只不过是换了层皮的庞氏骗局。里面有金子(就如当年泡沫里还是有移动通讯这块有价值的部分),但远不如吹的。
设计不下无尘室

#19 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 20日 07:30
Bluesky
newIdRobot 写了: 昨天 06:30 设计不下无尘室
最后也得下的。虽然现在有很多远程操控软件,可以跨州,甚至跨国调试,但具体到板子,很多情况得亲自操刀。现场的 tool driver 就算是老鸟,没责任心的也可能把板子给你烧了。

#20 Re: 普通程序员如何转行为高附加值的AI Engineer

发表于 : 2025年 7月 20日 12:39
noktard
狂赞!