这个已经最优了吗?能否让AI参与一下设计,看看能否继续提升?magagop 写了: 2025年 6月 22日 18:12 不是推理,是訓練。AI訓練相當於Top1超級計算機,把EECS領域過去50年所有的偏門技術都用上了,不是普通人可以想像。有技術搞AI訓練芯片的,全球不超過十家。真正搞AI訓練芯片的,一隻手能數過來。說AI簡單的,都是外行。
对GenAI现状感兴趣的推荐一点资料
版主: hci
#21 Re: 对GenAI现状感兴趣的推荐一点资料
标签/Tags:
#22 Re: 对GenAI现状感兴趣的推荐一点资料
跟我想得一样。以前还觉得人类个体的创造性是无可取代的,现在感觉越来越像刘慈欣早年一片科幻《诗云》里面的设定,都是计算而已。在AI还没有全面跟物理世界交互之前,需要些技术的蓝领工作可能是不多的绿洲了。fantasist 写了: 2025年 6月 21日 16:43 我一直认为想挣钱,得提供价值作为交换,所以错过了各种炒房炒币暴富的机会(哭死)。现在在ai还没完全成熟的时候加入,还能提供一些算法调优、搭建infra的价值。但过几年AI不仅智力全面超越绝大多数人类,与物理世界的交互也逐渐完善,大部分人可能陷入沦为无用阶层的道路上。那时候虽然工具肯定更好用,但个人能创造什么价值,还有没有干一番事业的机会,就很难说了。
可以稍微形象一点地探讨。前两年,你能让AI从知识库里给你生成一些答案,或者根据提示词生成一些质量勉强可以接受的图。今天,你已经可以跟AI agent对话,生成一个app挂到应用商店去;或者描述一些需求制订完整的旅游行程。只要AI实现了自动化某个之前需要人类介入的流程,对应的初级职位就消失了。很容易想象到,现在老板让你干的活,几年后很可能直接交待AI几句,AI就把最终结果完成了;或者几年后个人用的工具都完善到你想做什么,交待AI几句它能帮你完成,但别人也可以用到相同的AI。那么这种情况下,个人需要能提供其他人想不到或没有,而又有用,让别人愿意花钱买的信息,怎么看都是一件很难的事。等到那个时候发现自己成为无用阶层,再想努力已经晚了。所以我认为要早点做准备,不一定是学AI做AI本身,而是想明白未来的自己能提供什么独特的价值,以及怎么利用AI工具几天或几周后就能10x甚至100x自己的生产力,都是越早开始越好。
这一年开始学做股市交易。既然人没啥用了,就玩这种相互收割的游戏吧。
#23 Re: 对GenAI现状感兴趣的推荐一点资料
我以前以为人的思维是一种思考,比如数学题目,不知道怎么就找到办法了。其实都是学过的东西不停地试。最近我发现开发代码就是读懂文字,比如需求的文字说明,和别人讨论,看代码的注释,看代码本身。这些都是阅读理解,带着猜想,求证,然后写一些代码试试,编译,运行看看结果,逐步成型。oxo 写了: 2025年 6月 22日 18:50 跟我想得一样。以前还觉得人类个体的创造性是无可取代的,现在感觉越来越像刘慈欣早年一片科幻《诗云》里面的设定,都是计算而已。在AI还没有全面跟物理世界交互之前,需要些技术的蓝领工作可能是不多的绿洲了。
这一年开始学做股市交易。既然人没啥用了,就玩这种相互收割的游戏吧。
这个AI完全可以做了,就是要理解人类的语言而已。
#24 Re: 对GenAI现状感兴趣的推荐一点资料
不是問你原理,問你BLAS和Backpropagation怎麼在芯片上實現,多GPU如何協同,你懂嗎?不懂就別口出狂言。wildthing 写了: 2025年 6月 22日 18:44 什么乱七八糟的。GEMM的实现是CuBLAS。 这个也是把BLAS填到GPU上面。
backpropagation 就是partial derivation and chain rule.高中数学。
#31 Re: 对GenAI现状感兴趣的推荐一点资料
你这话搞多少级流水线预测的Intel也能说。说话客气一点。老牛从不认为自己是普通人。虽然老牛不做硬件。magagop 写了: 2025年 6月 22日 18:12 不是推理,是訓練。AI訓練相當於Top1超級計算機,把EECS領域過去50年所有的偏門技術都用上了,不是普通人可以想像。有技術搞AI訓練芯片的,全球不超過十家。真正搞AI訓練芯片的,一隻手能數過來。說AI簡單的,都是外行。
#32 Re: 对GenAI现状感兴趣的推荐一点资料
用计算复杂性的说法,只要差一个常数,训练3个月和3年或者30年没啥区别。硬件的确可以做很多优化。但硬件上不去,模型小一点而已。人类又不是等不起急着AGI。等芯片集成度上去了照样可以训练新模型。晚18个月芯片能力就上升了一倍。fantasist 写了: 2025年 6月 23日 00:09 我相信你纯软件写的东西能计算,但慢呀,训一轮要几天谁等的起。nvidia在硬件上就对这些有优化加速,配合cuda生态,构成了软硬结合的护城河。
#33 Re: 对GenAI现状感兴趣的推荐一点资料
模型小一点,能力差老远。目前开源模型里,几B参数量是toy model,几十B参数量是一些场景勉强能用,几百B参数量才能算强。现在几B的模型够小了都能放手机上,但没什么意义。牛河梁 写了: 2025年 6月 23日 00:16 用计算复杂性的说法,只要差一个常数,训练3个月和3年或者30年没啥区别。硬件的确可以做很多优化。但硬件上不去,模型小一点而已。人类又不是等不起急着AGI。等芯片集成度上去了照样可以训练新模型。晚18个月芯片能力就上升了一倍。
#34 Re: 对GenAI现状感兴趣的推荐一点资料
那一位说的问题Intel也有。如果连加减乘除都算不准。那么就去破产吧。fantasist 写了: 2025年 6月 23日 00:41 模型小一点,能力差老远。目前开源模型里,几B参数量是toy model,几十B参数量是一些场景勉强能用,几百B参数量才能算强。现在几B的模型够小了都能放手机上,但没什么意义。
你说的问题等N x 18个月都不是问题。老牛都等了20年了。假设现在举球之力只能搞几B。再过20年能搞多少B?
友情提示,按照摩尔定律,现在的算力是20年前的1万倍。
#36 Re: 对GenAI现状感兴趣的推荐一点资料
這又是沒有硬件經驗的瞎BB,聽過MCA和RAS嗎?計算時間越長越容易出錯,如果萬卡集群裡面有一個計算單元的硬件出錯了,你怎麼定位排除?牛河梁 写了: 2025年 6月 23日 00:16 用计算复杂性的说法,只要差一个常数,训练3个月和3年或者30年没啥区别。硬件的确可以做很多优化。但硬件上不去,模型小一点而已。人类又不是等不起急着AGI。等芯片集成度上去了照样可以训练新模型。晚18个月芯片能力就上升了一倍。
#37 Re: 对GenAI现状感兴趣的推荐一点资料
你知道短浮點數計算現在還沒有IEEE標準嗎?你知道這意味什麼嗎?紅綠藍廠的浮點數計算結果就是不一樣的,沒有誰對誰錯,但是普通用戶就傻眼了。牛河梁 写了: 2025年 6月 23日 00:48 那一位说的问题Intel也有。如果连加减乘除都算不准。那么就去破产吧。
你说的问题等N x 18个月都不是问题。老牛都等了20年了。假设现在举球之力只能搞几B。再过20年能搞多少B?
友情提示,按照摩尔定律,现在的算力是20年前的1万倍。
#39 Re: 对GenAI现状感兴趣的推荐一点资料
跟他们说这些没什么用,真搞过ai的不用说也懂。magagop 写了: 2025年 6月 23日 01:14 你知道短浮點數計算現在還沒有IEEE標準嗎?你知道這意味什麼嗎?紅綠藍廠的浮點數計算結果就是不一樣的,沒有誰對誰錯,但是普通用戶就傻眼了。
别说浮点精度了,计算图稍微差一点,矩阵相乘顺序不一样,结果就有误差。一个几十层的神经网络,误差累积起来很可观。所以amd华为之类做的训练卡虽然便宜,没什么人愿意去趟雷,因为数值都无法跟n卡对齐。