deepseek让ai计算中心瞬间冗余出来15/16的算力,原来1片英伟达b200做的事,现在1片a100可以做到了
嗯,英伟达股票还得跌,跌回a100时代,或者跌至最高点的1/16,一股10刀乐。难怪啊,老黄一语不发,保持沉默
版主: 牛河梁, alexwlt1024
jiml 写了: 2025年 2月 1日 01:29 deepseek对算力的要求大约是openAI的 1/16
deepseek让ai计算中心瞬间冗余出来15/16的算力,原来1片英伟达b200做的事,现在1片a100可以做到了
嗯,英伟达股票还得跌,跌回a100时代,或者跌至最高点的1/16,一股10刀乐。难怪啊,老黄一语不发,保持沉默![]()
就算需求增加,也不需要那么高端的芯片了,利润空间缩小
以前只能伦敦飞纽约biggestballs 写了: 2025年 2月 1日 08:31 就算需求增加,也不需要那么高端的芯片了,利润空间缩小
就好比伦敦飞纽约,协和式3小时到,普通飞机8小时,但协和式机票是普通飞机的3倍价格,你说一般人会怎么选?GPU很烧钱的,能省则省
问题是这个DS有没有说实话?比如它到底用了多少GPU?它开发出来的成本只有不到6million 美刀?
给你们这些非科班的简单解释就是:是训练时的强化学习和蒸馏模型省的成本,且业界普遍接受了这一事实Dididada 写了: 2025年 2月 1日 08:47 问题是这个DS有没有说实话?比如它到底用了多少GPU?它开发出来的成本只有不到6million 美刀?
据说它在2021年前就至少拥有10000块女大显卡了。
jiml 写了: 2025年 2月 1日 01:29 deepseek对算力的要求大约是openAI的 1/16
deepseek让ai计算中心瞬间冗余出来15/16的算力,原来1片英伟达b200做的事,现在1片a100可以做到了
嗯,英伟达股票还得跌,跌回a100时代,或者跌至最高点的1/16,一股10刀乐。难怪啊,老黄一语不发,保持沉默![]()
那为什么其他做AI的企业没有走DS这条路?不懂就问,谢谢解惑。biggestballs 写了: 2025年 2月 1日 08:53 给你们这些非科班的简单解释就是:是训练时的强化学习和蒸馏模型省的成本,且业界普遍接受了这一事实
用了多少GPU已经不重要了,你用它的算法你也能省,这个已经没有争议了
现在不是可以走了吗,总要有第一个吃螃蟹的,只是碰巧这次是天朝
我看有新闻说openai允许做研究的人这么做,但是不能用这种方法来开发竞争产品。那这是不是实际情况?如果是这样,那岂不是说DS很无耻?biggestballs 写了: 2025年 2月 1日 09:07 现在不是可以走了吗,总要有第一个吃螃蟹的,只是碰巧这次是天朝
引述网络的直接回答:“DeepSeek的一项创新是开辟了从一个更大、更强大的模型中获取相对较少的数据样本(不到一百万个)来显著提高较小模型能力的思路。这一新思路可能引来大量初创公司的效仿。”
所以DS就是光明正大的去偷,而且还大言不惭的说我就偷你的了,怎么着?你来咬我啊?赖美豪中 写了: 2025年 2月 1日 09:09 当然都用啊,但是人家都是用自己的模型蒸馏,比如网页版o1-mini就是gpt4的蒸馏,只有区区8b参数,性能远低于4o,但是deepshit通过逆向工程去把市面上所有的开源蒸馏完了还蒸馏gpt,这是一个他娘的创举,lol
jiml 写了: 2025年 2月 1日 01:29 deepseek对算力的要求大约是openAI的 1/16
deepseek让ai计算中心瞬间冗余出来15/16的算力,原来1片英伟达b200做的事,现在1片a100可以做到了
嗯,英伟达股票还得跌,跌回a100时代,或者跌至最高点的1/16,一股10刀乐。难怪啊,老黄一语不发,保持沉默![]()
那它吹嘘自己不到6million美刀就实现了模型开发的目的?就是为了做空女大?赖美豪中 写了: 2025年 2月 1日 09:17 当然不是正大光明,Deepshit逆向工程显然违反了gpt的term. 只能说openai这个公司因为太小缺少合格的cybersecurity团队,反而是微软的azure团队发现了以后通知了openai
可是一台h100就顶16台a100, 还是更省电,省钱。算力高,效率高永远更好。jiml 写了: 2025年 2月 1日 01:29 deepseek对算力的要求大约是openAI的 1/16
deepseek让ai计算中心瞬间冗余出来15/16的算力,原来1片英伟达b200做的事,现在1片a100可以做到了
嗯,英伟达股票还得跌,跌回a100时代,或者跌至最高点的1/16,一股10刀乐。难怪啊,老黄一语不发,保持沉默![]()
jiml 写了: 2025年 2月 1日 01:29 deepseek对算力的要求大约是openAI的 1/16
deepseek让ai计算中心瞬间冗余出来15/16的算力,原来1片英伟达b200做的事,现在1片a100可以做到了
嗯,英伟达股票还得跌,跌回a100时代,或者跌至最高点的1/16,一股10刀乐。难怪啊,老黄一语不发,保持沉默![]()