DeepSeek 训练成本低的真相

股市相关讨论

版主: 牛河梁alexwlt1024

ShuiNi(水泥)楼主
见习点评
见习点评
帖子互动: 341
帖子: 1804
注册时间: 2024年 4月 10日 14:22

#1 DeepSeek 训练成本低的真相

帖子 ShuiNi(水泥)楼主 »

就是蒸馏(distillation)其他大语言模型,尤其是ChatGPT的数据,掺一些原始数据,然后达到 ChatGPT 的水平,说自己训练成本低。

这相当于直接拿别人炼好的 99.99% 的纯金,和低品位金矿1:1混合之后去炼金,这样的炼金成本当然比从品位 0.0001% 的低品位金矿里炼黄金的成本要低得多。
----
我老还是太学术了,搞了个炼矿的概念,对非业内人士还是不够直接。还是下图通俗易懂。 :lol:

图片

+2.00 积分 [版主 牛河梁 发放的奖励]
x9 图片 x3 图片 x1 图片
上次由 ShuiNi 在 2025年 1月 29日 20:36 修改。

标签/Tags:
头像
牛河梁(别问我是谁)
论坛元老
论坛元老
2023年度十大优秀网友
2024年度优秀版主
牛河梁 的博客
帖子互动: 1389
帖子: 25603
注册时间: 2022年 11月 17日 21:21
联系:

#2 Re: DeepSeek 训练成本低的真相

帖子 牛河梁(别问我是谁) »

名白人。
bigballz
知名作家
知名作家
帖子互动: 51
帖子: 791
注册时间: 2024年 6月 7日 18:19

#3 Re: DeepSeek 训练成本低的真相

帖子 bigballz »

ShuiNi 写了: 2025年 1月 29日 12:40 就是精馏(distillation)其他大语言模型,尤其是ChatGPT的数据,掺一些原始数据,然后达到 ChatGPT 的水平,说自己训练成本低。

这相当于直接拿别人炼好的 99.99% 的纯金,和低品位金矿1:1混合之后去炼金,这样的炼金成本当然比从品位 0.0001% 的低品位金矿里炼黄金的成本要低得多。基本上和亩产万斤放卫星是一个路数。
你丫对ai 理解基本属于文盲级别

纯粹扯尼玛几把蛋

chatgpt 有几把自己的数据吗?

The same OpenAI who allegedly stole content from publications is accusing another AI company of stealing content? 😂
x3 图片 x1 图片 x2 图片
Smartguy
论坛点评
论坛点评
帖子互动: 274
帖子: 3026
注册时间: 2022年 11月 14日 22:09

#4 Re: DeepSeek 训练成本低的真相

帖子 Smartguy »

1 月 29 日消息,DeepSeek 应用已从意大利的 Google Play 和苹果 App Store 中下架。

虽然确切原因未知,但猜测可能与意大利隐私监管机构 Garante 此前对 DeepSeek 提出的数据隐私问题有关。

据路透社此前报道,当地时间 1 月 28 日,意大利隐私监管机构 Garante 表示,正要求中国人工智能公司 DeepSeek 提供关于个人数据使用问题的解释。

Garante 称,希望能了解 DeepSeek“收集了哪些个人数据、从哪些来源收集、用于什么目的、基于什么法律依据,以及是否存储在中国”。

Garante 在一份声明中称,DeepSeek 及其关联公司有 20 天时间作出答复。
maxthon
正式写手
正式写手
帖子互动: 19
帖子: 196
注册时间: 2022年 8月 24日 07:57

#5 Re: DeepSeek 训练成本低的真相

帖子 maxthon »

没这么简单,deepseek还是有一套自己的想法的。但是它的训练数据来源的确有问题,我不相信它可以用低算力就能达到好的训练结果。
ShuiNi 写了: 2025年 1月 29日 12:40 就是精馏(distillation)其他大语言模型,尤其是ChatGPT的数据,掺一些原始数据,然后达到 ChatGPT 的水平,说自己训练成本低。

这相当于直接拿别人炼好的 99.99% 的纯金,和低品位金矿1:1混合之后去炼金,这样的炼金成本当然比从品位 0.0001% 的低品位金矿里炼黄金的成本要低得多。基本上和亩产万斤放卫星是一个路数。
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 632
帖子: 6525
注册时间: 2022年 7月 23日 22:13

#6 Re: DeepSeek 训练成本低的真相

帖子 wass »

bigballz 写了: 2025年 1月 29日 12:46 你丫对ai 理解基本属于文盲级别

纯粹扯尼玛几把蛋

chatgpt 有几把自己的数据吗?

The same OpenAI who allegedly stole content from publications is accusing another AI company of stealing content? 😂
openai也有官司的
x1 图片
ShuiNi(水泥)楼主
见习点评
见习点评
帖子互动: 341
帖子: 1804
注册时间: 2024年 4月 10日 14:22

#7 Re: DeepSeek 训练成本低的真相

帖子 ShuiNi(水泥)楼主 »

bigballz 写了: 2025年 1月 29日 12:46 你丫对ai 理解基本属于文盲级别

纯粹扯尼玛几把蛋

chatgpt 有几把自己的数据吗?

The same OpenAI who allegedly stole content from publications is accusing another AI company of stealing content? 😂
ChatGPT 的数据是从互联网上浩如烟海的数据中拿出来的,原始数据属于谁可以有争议,ChatGPT 该不该无偿使用可以有争议,但人家好歹是从金矿石里面炼金,跟 DeepSeek 直接拿黄金成品炼金有本质区别。
x4 图片 x1 图片 x1 图片
头像
jiml
著名点评
著名点评
帖子互动: 364
帖子: 3359
注册时间: 2023年 2月 22日 22:50

#8 Re: DeepSeek 训练成本低的真相

帖子 jiml »

bigballz 写了: 2025年 1月 29日 12:46 你丫对ai 理解基本属于文盲级别

纯粹扯尼玛几把蛋

chatgpt 有几把自己的数据吗?

The same OpenAI who allegedly stole content from publications is accusing another AI company of stealing content? 😂
五毛卵子,"。。。级别"这种骂人话是从侬亲爹那里学的
x2 图片
ElonMusk
知名作家
知名作家
帖子互动: 58
帖子: 1225
注册时间: 2022年 7月 23日 22:49

#9 Re: DeepSeek 训练成本低的真相

帖子 ElonMusk »

你的理解是错的。算法本身决定了对数据量的需求,openai的算法,即使用同样蒸馏后的数据,也无法达到目前的水平。
ShuiNi 写了: 2025年 1月 29日 12:40 就是精馏(distillation)其他大语言模型,尤其是ChatGPT的数据,掺一些原始数据,然后达到 ChatGPT 的水平,说自己训练成本低。

这相当于直接拿别人炼好的 99.99% 的纯金,和低品位金矿1:1混合之后去炼金,这样的炼金成本当然比从品位 0.0001% 的低品位金矿里炼黄金的成本要低得多。
x2 图片
robot2022(R)
论坛精英
论坛精英
帖子互动: 308
帖子: 6885
注册时间: 2022年 12月 19日 13:28

#10 Re: DeepSeek 训练成本低的真相

帖子 robot2022(R) »

站在巨人肩膀上的意思?
那也行啊
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 771
帖子: 17318
注册时间: 2022年 7月 23日 23:48

#11 Re: DeepSeek 训练成本低的真相

帖子 hahan »

讲这些话p用也没有
Deepseek api定价不到openai的20分之一
效果差不多
给一个要用openai的理由
打桥牌的黄俄凋零殆尽
穿汉服的汉儿何能为也
bigballz
知名作家
知名作家
帖子互动: 51
帖子: 791
注册时间: 2024年 6月 7日 18:19

#12 Re: DeepSeek 训练成本低的真相

帖子 bigballz »

robot2022 写了: 2025年 1月 29日 13:15 站在巨人肩膀上的意思?
那也行啊
何况还是开源

尼玛github上让你拔到本地去玩
maxthon
正式写手
正式写手
帖子互动: 19
帖子: 196
注册时间: 2022年 8月 24日 07:57

#13 Re: DeepSeek 训练成本低的真相

帖子 maxthon »

你怎么知道?据我所知,正在开发gpt5采用的优化算法,将远超现有水平。即使现在,deepseek也只是在很小范围有比openai表现好一点。
ElonMusk 写了: 2025年 1月 29日 13:00 你的理解是错的。算法本身决定了对数据量的需求,openai的算法,即使用同样蒸馏后的数据,也无法达到目前的水平。
bigballz
知名作家
知名作家
帖子互动: 51
帖子: 791
注册时间: 2024年 6月 7日 18:19

#14 Re: DeepSeek 训练成本低的真相

帖子 bigballz »

maxthon 写了: 2025年 1月 29日 13:20 你怎么知道?据我所知,正在开发gpt5采用的优化算法,将远超现有水平。即使现在,deepseek也只是在很小范围有比openai表现好一点。
尼玛 和sora 一样 先来个修图 产品一年后都不见光?
ElonMusk
知名作家
知名作家
帖子互动: 58
帖子: 1225
注册时间: 2022年 7月 23日 22:49

#15 Re: DeepSeek 训练成本低的真相

帖子 ElonMusk »

你明显不懂DL,你根本没看明白我的帖子就反驳
maxthon 写了: 2025年 1月 29日 13:20 你怎么知道?据我所知,正在开发gpt5采用的优化算法,将远超现有水平。即使现在,deepseek也只是在很小范围有比openai表现好一点。
maxthon
正式写手
正式写手
帖子互动: 19
帖子: 196
注册时间: 2022年 8月 24日 07:57

#16 Re: DeepSeek 训练成本低的真相

帖子 maxthon »

理由很简单,deepseek对全世界构成安全风险,除了中国以外,全部被屏蔽,想用也不能用。
hahan 写了: 2025年 1月 29日 13:18 讲这些话p用也没有
Deepseek api定价不到openai的20分之一
效果差不多
给一个要用openai的理由
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 771
帖子: 17318
注册时间: 2022年 7月 23日 23:48

#17 Re: DeepSeek 训练成本低的真相

帖子 hahan »

maxthon 写了: 2025年 1月 29日 13:24 理由很简单,deepseek对全世界构成安全风险,除了中国以外,全部被屏蔽,想用也不能用。
呵呵
如果就剩这个理由
那美国ai泡泡就完全破了
打桥牌的黄俄凋零殆尽
穿汉服的汉儿何能为也
drifter
论坛精英
论坛精英
帖子互动: 396
帖子: 6854
注册时间: 2022年 9月 1日 04:17

#18 Re: DeepSeek 训练成本低的真相

帖子 drifter »

maxthon 写了: 2025年 1月 29日 13:24 理由很简单,deepseek对全世界构成安全风险,除了中国以外,全部被屏蔽,想用也不能用。
硅谷各大公司一边卖防火墙禁ds
一边自己跑ds
赢两边 😄
x1 图片
bigballz
知名作家
知名作家
帖子互动: 51
帖子: 791
注册时间: 2024年 6月 7日 18:19

#19 Re: DeepSeek 训练成本低的真相

帖子 bigballz »

drifter 写了: 2025年 1月 29日 13:26 硅谷各大公司一边卖防火墙禁ds
一边自己跑ds
赢两边 😄
稳了lol
maxthon
正式写手
正式写手
帖子互动: 19
帖子: 196
注册时间: 2022年 8月 24日 07:57

#20 Re: DeepSeek 训练成本低的真相

帖子 maxthon »

这和DL有什么关系?而且你说话能不能说清楚一点,可以指出我哪一点说的不对,才能继续讨论。
ElonMusk 写了: 2025年 1月 29日 13:23 你明显不懂DL,你根本没看明白我的帖子就反驳
回复

回到 “股海弄潮(Stock)”