(转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

STEM版,合并数学,物理,化学,科学,工程,机械。不包括生物、医学相关,和计算机相关内容。

版主: verdeliteTheMatrix

头像
TheMatrix楼主
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 260
帖子: 13165
注册时间: 2022年 7月 26日 00:35

#1 (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 TheMatrix楼主 »

此帖转自 C999 在 史海钩沉(History) 的帖子:迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

来自 加拿大的资深IT从业者,“二姐夫”


标签/Tags:
头像
TheMatrix楼主
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 260
帖子: 13165
注册时间: 2022年 7月 26日 00:35

#2 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 TheMatrix楼主 »

TheMatrix 写了: 2025年 1月 31日 14:24 此帖转自 C999 在 史海钩沉(History) 的帖子:迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

来自 加拿大的资深IT从业者,“二姐夫”

这个我看了。讲得确实不错。
princeton(wow)
知名人士
知名人士
帖子互动: 3
帖子: 55
注册时间: 2022年 10月 15日 17:20

#3 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 princeton(wow) »

ChatGPT应是用Microsoft的搜索引擎Bing得到数据,而DeepSeek没有自已的搜索引擎,也没听说DeepSeek和哪个搜索引擎公司合作, 也许DeepSeek付费给OpenAI来取得数据,这也可能是OpenAI获利的途径之一,也许有很多这样的小公司付费给OpenAI.
未名空间
论坛点评
论坛点评
帖子互动: 116
帖子: 2326
注册时间: 2022年 7月 28日 22:51

#4 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 未名空间 »

不错
头像
HouseMD(黄皮川黑)
著名点评
著名点评
帖子互动: 614
帖子: 4235
注册时间: 2022年 7月 28日 14:44

#5 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 HouseMD(黄皮川黑) »

tldr: deepseek弯道超车,集合各种工程技术优秀实现下,更低成本实现接近openai的gpt。以他(jeff)的认知,deepseek没可能从openai蒸馏提取知识
x2 图片
图片
ghnc(顿巴斯之鹰)
著名点评
著名点评
帖子互动: 199
帖子: 3340
注册时间: 2022年 9月 5日 03:32

#6 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 ghnc(顿巴斯之鹰) »

蒸馏别人的就是非法的,等着被搞死吧
x2 图片
头像
HouseMD(黄皮川黑)
著名点评
著名点评
帖子互动: 614
帖子: 4235
注册时间: 2022年 7月 28日 14:44

#7 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 HouseMD(黄皮川黑) »

ghnc 写了: 2025年 2月 1日 03:11 蒸馏别人的就是非法的,等着被搞死吧
lol 你们是没看视频还是没看懂视频
x1 图片
图片
头像
司马脱(滚床单指导员)
著名点评
著名点评
帖子互动: 228
帖子: 5138
注册时间: 2022年 7月 26日 06:19

#8 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 司马脱(滚床单指导员) »

卧槽这孙子外号姐夫,意思说得到位,赞一个
头像
mmking(上水)
论坛精英
论坛精英
帖子互动: 1174
帖子: 8526
注册时间: 2023年 1月 25日 05:10

#9 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 mmking(上水) »

围观一下小白
ghnc 写了: 2025年 2月 1日 03:11 蒸馏别人的就是非法的,等着被搞死吧
x1 图片 x1 图片
又开赌盘了,美军是否会继续打击伊朗,速来速来:viewtopic.php?t=818768

凡所有相,皆是虚妄
头像
saibaster(神的眷者)
论坛点评
论坛点评
帖子互动: 244
帖子: 2665
注册时间: 2023年 7月 11日 00:43

#10 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 saibaster(神的眷者) »

你这通篇都是外行的臆想,卖数据的公司多了去了。公开的数据集也多了去了。谁付费给open AI买数据啊?你从哪里听来的open AI卖自己的数据?
princeton 写了: 2025年 1月 31日 17:49 ChatGPT应是用Microsoft的搜索引擎Bing得到数据,而DeepSeek没有自已的搜索引擎,也没听说DeepSeek和哪个搜索引擎公司合作, 也许DeepSeek付费给OpenAI来取得数据,这也可能是OpenAI获利的途径之一,也许有很多这样的小公司付费给OpenAI.
x1 图片
头像
mmking(上水)
论坛精英
论坛精英
帖子互动: 1174
帖子: 8526
注册时间: 2023年 1月 25日 05:10

#11 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 mmking(上水) »

这里有好多门外汉想凭着“常识”指导一切
saibaster 写了: 2025年 2月 1日 06:12 你这通篇都是外行的臆想,卖数据的公司多了去了。公开的数据集也多了去了。谁付费给open AI买数据啊?你从哪里听来的open AI卖自己的数据?
又开赌盘了,美军是否会继续打击伊朗,速来速来:viewtopic.php?t=818768

凡所有相,皆是虚妄
头像
liufanghe
论坛点评
论坛点评
帖子互动: 196
帖子: 2182
注册时间: 2022年 9月 18日 22:37

#12 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 liufanghe »

这个太科普了,希望谁提供一些英文的更专业一些的
视频播主其实倾向性蛮强的,
我同意他的说法。
“Information is power. But like all power, there are those who want to keep it for themselves.” ― Aaron Swartz

在新水木看到的有哲理的回答
月收入 1 万是个什么样的水平?拿的人能接受,看的人说 “活不下去” 的水平。
可怜的美华。上半辈子折腾美国签证,下半辈子折腾中国签证。
princeton(wow)
知名人士
知名人士
帖子互动: 3
帖子: 55
注册时间: 2022年 10月 15日 17:20

#13 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 princeton(wow) »

saibaster 写了: 2025年 2月 1日 06:12 你这通篇都是外行的臆想,卖数据的公司多了去了。公开的数据集也多了去了。谁付费给open AI买数据啊?你从哪里听来的open AI卖自己的数据?
哈哈,本就是外行,只是想问问。DS怎么得到数据?经过Bing还是Google还是别的什么搜索引擎?Bing和Google是公开的,但对DS这样的商业行为还会是free的么?我只是好奇。
红烛歌楼
见习点评
见习点评
帖子互动: 90
帖子: 2006
注册时间: 2024年 9月 18日 21:29

#14 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 红烛歌楼 »

估计地球人的数据,尤其脸部数据,都已经被卖很多次了。至于你的什么学历专业等等从简历里可以随便得到的数据,早都被卖无数次了
此网站Yesterday 写了: ↑
(得了癌症)复发也可以治,治愈本来就不应该是目标。
得了癌症治疗的目标本来就是不应该治愈,那是啥?还复发也可以治?什么鬼?别说复发,就说第一次被诊断出xxCa.,多少人当场崩溃?还复发可以治?我几个亲戚都是复发了人完了,怎么不治了?推诿回家等S呢?
FoxMe(令狐)
著名点评
著名点评
帖子互动: 132
帖子: 5164
注册时间: 2022年 7月 26日 16:46

#15 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 FoxMe(令狐) »

这不就是传统的有监督(老师)学习吗?只不过这里,GPT是老师,Deepseek是学生,本质上还是函数拟合。

这里的蒸馏和以前transformer里的knowledge distillation有啥区别?
TheMatrix 写了: 2025年 1月 31日 14:24 此帖转自 C999 在 史海钩沉(History) 的帖子:迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

来自 加拿大的资深IT从业者,“二姐夫”

头像
ccmath
论坛精英
论坛精英
帖子互动: 363
帖子: 7156
注册时间: 2022年 9月 17日 19:18

#16 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 ccmath »

Distill不是让人想起酿酒就是做包子

其实本质就是, 人类知识是有结构体系的,自然语言文本也是有结构的。通过对结构的理解优化一下算法,做出来只是时间问题。openai 之前一系列的论文 trail, 已经给出了很多优化的可能性。
TheMatrix 写了: 2025年 1月 31日 14:24 此帖转自 C999 在 史海钩沉(History) 的帖子:迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

来自 加拿大的资深IT从业者,“二姐夫”

ghnc(顿巴斯之鹰)
著名点评
著名点评
帖子互动: 199
帖子: 3340
注册时间: 2022年 9月 5日 03:32

#17 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 ghnc(顿巴斯之鹰) »

傻子不信我等着看deep fuck被fuck up吧
Fnhdx
论坛点评
论坛点评
帖子互动: 126
帖子: 2201
注册时间: 2022年 8月 31日 21:40

#18 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 Fnhdx »

有一点不懂,25万个问题就可以训练一个大模型?那我直接人工标注25万个问题不是更好?
头像
saibaster(神的眷者)
论坛点评
论坛点评
帖子互动: 244
帖子: 2665
注册时间: 2023年 7月 11日 00:43

#19 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 saibaster(神的眷者) »

公开能得到的数据已经是天量了。
我自己的训练都能搞到整个wikipedia 和 twitter的
很多卖数据的公司也就是给你做些数据清洗和标注而已。
OpenAI 训练的数据很多也是自己到处扒下来的。
但 Google 和 OpenAI 自己就在局里,怎么可能卖数据。
princeton 写了: 2025年 2月 1日 09:20 哈哈,本就是外行,只是想问问。DS怎么得到数据?经过Bing还是Google还是别的什么搜索引擎?Bing和Google是公开的,但对DS这样的商业行为还会是free的么?我只是好奇。
头像
saibaster(神的眷者)
论坛点评
论坛点评
帖子互动: 244
帖子: 2665
注册时间: 2023年 7月 11日 00:43

#20 Re: (转载)迄今最好的介绍deepseek所谓“蒸馏”,以及可能超越OpenAI的地方

帖子 saibaster(神的眷者) »

自己去做些research 再来夸夸其谈不行吗?怎么都是这种闭着眼睛说胡话的。
你的GPT是指什么?GPT2的话倒是开源,但你用几年前的东西做蒸馏?倒是可以,
你要说把 OpenAI 不开源的东西来“蒸馏”,我建议你先去学习“蒸馏”是什么。
FoxMe 写了: 2025年 2月 1日 10:06 这不就是传统的有监督(老师)学习吗?只不过这里,GPT是老师,Deepseek是学生,本质上还是函数拟合。

这里的蒸馏和以前transformer里的knowledge distillation有啥区别?
上次由 saibaster 在 2025年 2月 1日 14:23 修改。
回复

回到 “STEM”