普通程序员如何转行为高附加值的AI Engineer

版主: hci

回复
fantasist楼主
见习点评
见习点评
帖子互动: 170
帖子: 1442
注册时间: 2022年 7月 24日 19:52

#1 普通程序员如何转行为高附加值的AI Engineer

帖子 fantasist楼主 »

本来想写一篇,发现朋友做了一期视频,大方向上讲的挺好,直接看吧。


看起来他们公司老板跑路后算法层面没什么大牛,对于pre-train/post-train research work不太了解。我认为coding强的码工只要下苦功,转行成researcher还是很有希望的。比如pre-train和post-train都需要数据,有很强文字等数据处理经验的码工完全可以搞一搞。infra层面,比如最近kimi-k2对muon optimizer的改进,就是通过各种实验想办法增强计算的numerical stability,其中占很大比例的搬砖的活我觉得普通程序员只要去做就有机会胜任。
最大的难点还是怎么去找到相关的工作。pre-train的厂家屈指可数,做出过能拿的出手的foundation model,确实都是世界上最顶尖的AI人才,经验积累不强的人往上靠的机会非常渺茫。而投入大量资源的做post-train的其实很少,不是视频里说的大多数公司都在(能)做。我比较了解的一些有一定资金实力的中厂,比如roblox和service now,想做post-train但都没多少卡,当然吸引不到好的researcher也不太可能做出厉害的成果。从实际的角度出发,选合适的AI公司去搞偏产品的backend和frontend比较容易,相应的基本没有溢价,主要是也许能找到机会再往AI顶层靠。

+1.00 积分 [版主 hci 发放的奖励]
x1 图片

标签/Tags:
Whyisthis(为什么会这样)
职业作家
职业作家
帖子互动: 47
帖子: 472
注册时间: 2022年 11月 17日 16:22

#2 Re: 普通程序员如何转行为高附加值的AI Engineer

帖子 Whyisthis(为什么会这样) »

就怕换跑道转行,哼哧哼哧学几年,大模型这把火烧过了不再流行了。
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 830
帖子: 18043
注册时间: 2022年 7月 23日 23:48

#3 Re: 普通程序员如何转行为高附加值的AI Engineer

帖子 hahan »

Engineering 的东西谁都能做
大一的知识储备足矣
问题是phd都一大堆供远大于求
连生物phd现在都转ai
谁会找普通swe呢
急急如丧家之犬
忙忙似漏网之鱼
magagop
见习点评
见习点评
帖子互动: 113
帖子: 1660
注册时间: 2024年 12月 5日 17:35

#4 Re: 普通程序员如何转行为高附加值的AI Engineer

帖子 magagop »

fantasist 写了: 昨天 01:55 本来想写一篇,发现朋友做了一期视频,大方向上讲的挺好,直接看吧。


看起来他们公司老板跑路后算法层面没什么大牛,对于pre-train/post-train research work不太了解。我认为coding强的码工只要下苦功,转行成researcher还是很有希望的。比如pre-train和post-train都需要数据,有很强文字等数据处理经验的码工完全可以搞一搞。infra层面,比如最近kimi-k2对muon optimizer的改进,就是通过各种实验想办法增强计算的numerical stability,其中占很大比例的搬砖的活我觉得普通程序员只要去做就有机会胜任。
最大的难点还是怎么去找到相关的工作。pre-train的厂家屈指可数,做出过能拿的出手的foundation model,确实都是世界上最顶尖的AI人才,经验积累不强的人往上靠的机会非常渺茫。而投入大量资源的做post-train的其实很少,不是视频里说的大多数公司都在(能)做。我比较了解的一些有一定资金实力的中厂,比如roblox和service now,想做post-train但都没多少卡,当然吸引不到好的researcher也不太可能做出厉害的成果。从实际的角度出发,选合适的AI公司去搞偏产品的backend和frontend比较容易,相应的基本没有溢价,主要是也许能找到机会再往AI顶层靠。
這個視頻完全沒有講AI加速器芯片和GPU芯片,那也是一個方向,不一定非要做LLM模型的才是AI,做芯片的當然也是AI。模型越來越大,最關鍵的瓶頸是硬件芯片,不是模型專家。
上次由 magagop 在 2025年 7月 18日 12:10 修改。
magagop
见习点评
见习点评
帖子互动: 113
帖子: 1660
注册时间: 2024年 12月 5日 17:35

#5 Re: 普通程序员如何转行为高附加值的AI Engineer

帖子 magagop »

hahan 写了: 昨天 11:53 Engineering 的东西谁都能做
大一的知识储备足矣
问题是phd都一大堆供远大于求
连生物phd现在都转ai
谁会找普通swe呢
大一知識儲備不能做AI芯片,生物PhD也不能轉AI芯片方向
fantasist楼主
见习点评
见习点评
帖子互动: 170
帖子: 1442
注册时间: 2022年 7月 24日 19:52

#6 Re: 普通程序员如何转行为高附加值的AI Engineer

帖子 fantasist楼主 »

hahan 写了: 昨天 11:53 Engineering 的东西谁都能做
大一的知识储备足矣
问题是phd都一大堆供远大于求
连生物phd现在都转ai
谁会找普通swe呢
天上不会掉馅饼,机会是要自己去争取的。学校里的phd算法方面再怎么强,engineering方面肯定没industry SWE多,各有优势。
fantasist楼主
见习点评
见习点评
帖子互动: 170
帖子: 1442
注册时间: 2022年 7月 24日 19:52

#7 Re: 普通程序员如何转行为高附加值的AI Engineer

帖子 fantasist楼主 »

magagop 写了: 昨天 12:07 這個視頻完全沒有講AI加速器芯片和GPU芯片,那也是一個方向,不一定非要做LLM模型的才是AI,做芯片的當然也是AI。模型越來越大,最關鍵的瓶頸是硬件芯片,不是模型專家。
硬件工程师在硅谷包裹一般是SWE的一半,没人会往这方向转吧,除非搞AI芯片能发大包。据我所知nvidia和amd做AI硬件的base和equity都很少(不算nvidia股价涨幅)。
写CUDA kernel之类的应该算AI infra,在inference stack里应用广泛,也是一条之前没细讲的出路,这个其实挺适合Infra SWE。
magagop
见习点评
见习点评
帖子互动: 113
帖子: 1660
注册时间: 2024年 12月 5日 17:35

#8 Re: 普通程序员如何转行为高附加值的AI Engineer

帖子 magagop »

fantasist 写了: 昨天 12:19 硬件工程师在硅谷包裹一般是SWE的一半,没人会往这方向转吧,除非搞AI芯片能发大包。据我所知nvidia和amd做AI硬件的base和equity都很少(不算nvidia股价涨幅)。
写CUDA kernel之类的应该算AI infra,在inference stack里应用广泛,也是一条之前没细讲的出路,这个其实挺适合Infra SWE。
芯片好處是通用,AI不行了,還有別的,也沒人過來卷。
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 830
帖子: 18043
注册时间: 2022年 7月 23日 23:48

#9 Re: 普通程序员如何转行为高附加值的AI Engineer

帖子 hahan »

fantasist 写了: 昨天 01:55 本来想写一篇,发现朋友做了一期视频,大方向上讲的挺好,直接看吧。


看起来他们公司老板跑路后算法层面没什么大牛,对于pre-train/post-train research work不太了解。我认为coding强的码工只要下苦功,转行成researcher还是很有希望的。比如pre-train和post-train都需要数据,有很强文字等数据处理经验的码工完全可以搞一搞。infra层面,比如最近kimi-k2对muon optimizer的改进,就是通过各种实验想办法增强计算的numerical stability,其中占很大比例的搬砖的活我觉得普通程序员只要去做就有机会胜任。
最大的难点还是怎么去找到相关的工作。pre-train的厂家屈指可数,做出过能拿的出手的foundation model,确实都是世界上最顶尖的AI人才,经验积累不强的人往上靠的机会非常渺茫。而投入大量资源的做post-train的其实很少,不是视频里说的大多数公司都在(能)做。我比较了解的一些有一定资金实力的中厂,比如roblox和service now,想做post-train但都没多少卡,当然吸引不到好的researcher也不太可能做出厉害的成果。从实际的角度出发,选合适的AI公司去搞偏产品的backend和frontend比较容易,相应的基本没有溢价,主要是也许能找到机会再往AI顶层靠。
这是你朋友
看了下频道节目
No offense
精致利己小市民气到disgusting 的程度
急急如丧家之犬
忙忙似漏网之鱼
fantasist楼主
见习点评
见习点评
帖子互动: 170
帖子: 1442
注册时间: 2022年 7月 24日 19:52

#10 Re: 普通程序员如何转行为高附加值的AI Engineer

帖子 fantasist楼主 »

hahan 写了: 昨天 21:08 这是你朋友
看了下频道节目
No offense
精致利己小市民气到disgusting 的程度
这世界不利己就干到60岁还在搬砖,找高回报的work有啥可指摘的?newgrad不想明白这些也没人指点的话,很可能一晃十年过去成为老黄牛,大好青春都浪费了。
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 695
帖子: 7088
注册时间: 2022年 7月 23日 22:13

#11 Re: 普通程序员如何转行为高附加值的AI Engineer

帖子 wass »

hahan 写了: 昨天 11:53 Engineering 的东西谁都能做
大一的知识储备足矣
问题是phd都一大堆供远大于求
连生物phd现在都转ai
谁会找普通swe呢
open ai为了解决这个问题,把researcher和swe都叫tech Staff
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 695
帖子: 7088
注册时间: 2022年 7月 23日 22:13

#12 Re: 普通程序员如何转行为高附加值的AI Engineer

帖子 wass »

看看DeepSeek的进步,多数属于se
Bluesky
论坛支柱
论坛支柱
帖子互动: 775
帖子: 10474
注册时间: 2022年 7月 24日 11:52

#13 Re: 普通程序员如何转行为高附加值的AI Engineer

帖子 Bluesky »

magagop 写了: 昨天 12:07 這個視頻完全沒有講AI加速器芯片和GPU芯片,那也是一個方向,不一定非要做LLM模型的才是AI,做芯片的當然也是AI。模型越來越大,最關鍵的瓶頸是硬件芯片,不是模型專家。
芯片不是谁都能做,起码得懂半导体集成电路基本知识,加上还得穿大白下工厂超净室。秀才们能吃得了这种苦?现在的AI和当年的稻糠母泡沫一样,只不过是换了层皮的庞氏骗局。里面有金子(就如当年泡沫里还是有移动通讯这块有价值的部分),但远不如吹的。
Bluesky
论坛支柱
论坛支柱
帖子互动: 775
帖子: 10474
注册时间: 2022年 7月 24日 11:52

#14 Re: 普通程序员如何转行为高附加值的AI Engineer

帖子 Bluesky »

当年大学里学历史的,学教育的,学电影的,都一股脑扎堆计算机科学系。。。。it挣钱嘛
回复

回到 “葵花宝典(Programming)”