普通程序员如何转行为高附加值的AI Engineer
版主: hci
#1 普通程序员如何转行为高附加值的AI Engineer
本来想写一篇,发现朋友做了一期视频,大方向上讲的挺好,直接看吧。
看起来他们公司老板跑路后算法层面没什么大牛,对于pre-train/post-train research work不太了解。我认为coding强的码工只要下苦功,转行成researcher还是很有希望的。比如pre-train和post-train都需要数据,有很强文字等数据处理经验的码工完全可以搞一搞。infra层面,比如最近kimi-k2对muon optimizer的改进,就是通过各种实验想办法增强计算的numerical stability,其中占很大比例的搬砖的活我觉得普通程序员只要去做就有机会胜任。
最大的难点还是怎么去找到相关的工作。pre-train的厂家屈指可数,做出过能拿的出手的foundation model,确实都是世界上最顶尖的AI人才,经验积累不强的人往上靠的机会非常渺茫。而投入大量资源的做post-train的其实很少,不是视频里说的大多数公司都在(能)做。我比较了解的一些有一定资金实力的中厂,比如roblox和service now,想做post-train但都没多少卡,当然吸引不到好的researcher也不太可能做出厉害的成果。从实际的角度出发,选合适的AI公司去搞偏产品的backend和frontend比较容易,相应的基本没有溢价,主要是也许能找到机会再往AI顶层靠。
看起来他们公司老板跑路后算法层面没什么大牛,对于pre-train/post-train research work不太了解。我认为coding强的码工只要下苦功,转行成researcher还是很有希望的。比如pre-train和post-train都需要数据,有很强文字等数据处理经验的码工完全可以搞一搞。infra层面,比如最近kimi-k2对muon optimizer的改进,就是通过各种实验想办法增强计算的numerical stability,其中占很大比例的搬砖的活我觉得普通程序员只要去做就有机会胜任。
最大的难点还是怎么去找到相关的工作。pre-train的厂家屈指可数,做出过能拿的出手的foundation model,确实都是世界上最顶尖的AI人才,经验积累不强的人往上靠的机会非常渺茫。而投入大量资源的做post-train的其实很少,不是视频里说的大多数公司都在(能)做。我比较了解的一些有一定资金实力的中厂,比如roblox和service now,想做post-train但都没多少卡,当然吸引不到好的researcher也不太可能做出厉害的成果。从实际的角度出发,选合适的AI公司去搞偏产品的backend和frontend比较容易,相应的基本没有溢价,主要是也许能找到机会再往AI顶层靠。
+1.00 积分 [版主 hci 发放的奖励]
x1

标签/Tags:
#3 Re: 普通程序员如何转行为高附加值的AI Engineer
Engineering 的东西谁都能做
大一的知识储备足矣
问题是phd都一大堆供远大于求
连生物phd现在都转ai
谁会找普通swe呢
大一的知识储备足矣
问题是phd都一大堆供远大于求
连生物phd现在都转ai
谁会找普通swe呢
急急如丧家之犬
忙忙似漏网之鱼
忙忙似漏网之鱼
#4 Re: 普通程序员如何转行为高附加值的AI Engineer
這個視頻完全沒有講AI加速器芯片和GPU芯片,那也是一個方向,不一定非要做LLM模型的才是AI,做芯片的當然也是AI。模型越來越大,最關鍵的瓶頸是硬件芯片,不是模型專家。fantasist 写了: 昨天 01:55 本来想写一篇,发现朋友做了一期视频,大方向上讲的挺好,直接看吧。
看起来他们公司老板跑路后算法层面没什么大牛,对于pre-train/post-train research work不太了解。我认为coding强的码工只要下苦功,转行成researcher还是很有希望的。比如pre-train和post-train都需要数据,有很强文字等数据处理经验的码工完全可以搞一搞。infra层面,比如最近kimi-k2对muon optimizer的改进,就是通过各种实验想办法增强计算的numerical stability,其中占很大比例的搬砖的活我觉得普通程序员只要去做就有机会胜任。
最大的难点还是怎么去找到相关的工作。pre-train的厂家屈指可数,做出过能拿的出手的foundation model,确实都是世界上最顶尖的AI人才,经验积累不强的人往上靠的机会非常渺茫。而投入大量资源的做post-train的其实很少,不是视频里说的大多数公司都在(能)做。我比较了解的一些有一定资金实力的中厂,比如roblox和service now,想做post-train但都没多少卡,当然吸引不到好的researcher也不太可能做出厉害的成果。从实际的角度出发,选合适的AI公司去搞偏产品的backend和frontend比较容易,相应的基本没有溢价,主要是也许能找到机会再往AI顶层靠。
上次由 magagop 在 2025年 7月 18日 12:10 修改。
#6 Re: 普通程序员如何转行为高附加值的AI Engineer
天上不会掉馅饼,机会是要自己去争取的。学校里的phd算法方面再怎么强,engineering方面肯定没industry SWE多,各有优势。
#7 Re: 普通程序员如何转行为高附加值的AI Engineer
硬件工程师在硅谷包裹一般是SWE的一半,没人会往这方向转吧,除非搞AI芯片能发大包。据我所知nvidia和amd做AI硬件的base和equity都很少(不算nvidia股价涨幅)。magagop 写了: 昨天 12:07 這個視頻完全沒有講AI加速器芯片和GPU芯片,那也是一個方向,不一定非要做LLM模型的才是AI,做芯片的當然也是AI。模型越來越大,最關鍵的瓶頸是硬件芯片,不是模型專家。
写CUDA kernel之类的应该算AI infra,在inference stack里应用广泛,也是一条之前没细讲的出路,这个其实挺适合Infra SWE。
#8 Re: 普通程序员如何转行为高附加值的AI Engineer
芯片好處是通用,AI不行了,還有別的,也沒人過來卷。fantasist 写了: 昨天 12:19 硬件工程师在硅谷包裹一般是SWE的一半,没人会往这方向转吧,除非搞AI芯片能发大包。据我所知nvidia和amd做AI硬件的base和equity都很少(不算nvidia股价涨幅)。
写CUDA kernel之类的应该算AI infra,在inference stack里应用广泛,也是一条之前没细讲的出路,这个其实挺适合Infra SWE。
#9 Re: 普通程序员如何转行为高附加值的AI Engineer
这是你朋友fantasist 写了: 昨天 01:55 本来想写一篇,发现朋友做了一期视频,大方向上讲的挺好,直接看吧。
看起来他们公司老板跑路后算法层面没什么大牛,对于pre-train/post-train research work不太了解。我认为coding强的码工只要下苦功,转行成researcher还是很有希望的。比如pre-train和post-train都需要数据,有很强文字等数据处理经验的码工完全可以搞一搞。infra层面,比如最近kimi-k2对muon optimizer的改进,就是通过各种实验想办法增强计算的numerical stability,其中占很大比例的搬砖的活我觉得普通程序员只要去做就有机会胜任。
最大的难点还是怎么去找到相关的工作。pre-train的厂家屈指可数,做出过能拿的出手的foundation model,确实都是世界上最顶尖的AI人才,经验积累不强的人往上靠的机会非常渺茫。而投入大量资源的做post-train的其实很少,不是视频里说的大多数公司都在(能)做。我比较了解的一些有一定资金实力的中厂,比如roblox和service now,想做post-train但都没多少卡,当然吸引不到好的researcher也不太可能做出厉害的成果。从实际的角度出发,选合适的AI公司去搞偏产品的backend和frontend比较容易,相应的基本没有溢价,主要是也许能找到机会再往AI顶层靠。
看了下频道节目
No offense
精致利己小市民气到disgusting 的程度
急急如丧家之犬
忙忙似漏网之鱼
忙忙似漏网之鱼
#10 Re: 普通程序员如何转行为高附加值的AI Engineer
这世界不利己就干到60岁还在搬砖,找高回报的work有啥可指摘的?newgrad不想明白这些也没人指点的话,很可能一晃十年过去成为老黄牛,大好青春都浪费了。
#13 Re: 普通程序员如何转行为高附加值的AI Engineer
芯片不是谁都能做,起码得懂半导体集成电路基本知识,加上还得穿大白下工厂超净室。秀才们能吃得了这种苦?现在的AI和当年的稻糠母泡沫一样,只不过是换了层皮的庞氏骗局。里面有金子(就如当年泡沫里还是有移动通讯这块有价值的部分),但远不如吹的。magagop 写了: 昨天 12:07 這個視頻完全沒有講AI加速器芯片和GPU芯片,那也是一個方向,不一定非要做LLM模型的才是AI,做芯片的當然也是AI。模型越來越大,最關鍵的瓶頸是硬件芯片,不是模型專家。