(转载)deepseek R1推理全面接近O1

STEM版,合并数学,物理,化学,科学,工程,机械。不包括生物、医学相关,和计算机相关内容。

版主: verdeliteTheMatrix

Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 513
帖子: 23543
注册时间: 2022年 7月 24日 17:21

#1 (转载)deepseek R1推理全面接近O1

帖子 Caravel楼主 »

此帖转自 Caravel 在 军事天地(Military) 的帖子:deepseek R1推理全面接近O1

性能接近o1,便宜96.4%
完全开源


标签/Tags:
赖美豪中(my pronouns: ha/ha)
论坛元老
论坛元老
2023年度优秀版主
帖子互动: 3525
帖子: 41430
注册时间: 2022年 9月 6日 12:50

#2 Re: (转载)deepseek R1推理全面接近O1

帖子 赖美豪中(my pronouns: ha/ha) »

深得amd苏妈真传,amd以前就很会玩这套。我老记得特别清楚当年买来号称远超486的k5, 干就一个字
Caravel 写了: 2025年 1月 20日 21:52 此帖转自 Caravel 在 军事天地(Military) 的帖子:deepseek R1推理全面接近O1

性能接近o1,便宜96.4%
完全开源

If printing money would end poverty, printing diplomas would end stupidity.
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 513
帖子: 23543
注册时间: 2022年 7月 24日 17:21

#3 Re: (转载)deepseek R1推理全面接近O1

帖子 Caravel楼主 »

赖美豪中 写了: 2025年 1月 21日 13:57 深得amd苏妈真传,amd以前就很会玩这套。我老记得特别清楚当年买来号称远超486的k5, 干就一个字
要说作假,openai作假可能性更大
R1是全开源,oAI的很多model都没法测试
现在很多人可以自己跑R1,效果不错
赖美豪中(my pronouns: ha/ha)
论坛元老
论坛元老
2023年度优秀版主
帖子互动: 3525
帖子: 41430
注册时间: 2022年 9月 6日 12:50

#4 Re: (转载)deepseek R1推理全面接近O1

帖子 赖美豪中(my pronouns: ha/ha) »

deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么
Caravel 写了: 2025年 1月 21日 14:02 要说作假,openai作假可能性更大
R1是全开源,oAI的很多model都没法测试
现在很多人可以自己跑R1,效果不错
If printing money would end poverty, printing diplomas would end stupidity.
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 513
帖子: 23543
注册时间: 2022年 7月 24日 17:21

#5 Re: (转载)deepseek R1推理全面接近O1

帖子 Caravel楼主 »

赖美豪中 写了: 2025年 1月 21日 14:05 deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么
没那么简单,o1出来半年了吧,如果按照你说的简单,那随便一个公司就应该做出o1级别的?

他们论文提到了没有人工标注数据的强化学习,就像alphazero一样self play。
赖美豪中(my pronouns: ha/ha)
论坛元老
论坛元老
2023年度优秀版主
帖子互动: 3525
帖子: 41430
注册时间: 2022年 9月 6日 12:50

#6 Re: (转载)deepseek R1推理全面接近O1

帖子 赖美豪中(my pronouns: ha/ha) »

别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
Caravel 写了: 2025年 1月 21日 14:18 没那么简单,o1出来半年了吧,如果按照你说的简单,那随便一个公司就应该做出o1级别的?

他们论文提到了没有人工标注数据的强化学习,就像alphazero一样self play。
If printing money would end poverty, printing diplomas would end stupidity.
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 513
帖子: 23543
注册时间: 2022年 7月 24日 17:21

#7 Re: (转载)deepseek R1推理全面接近O1

帖子 Caravel楼主 »

赖美豪中 写了: 2025年 1月 21日 14:40 别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
用别的model生成数据是通行做法,以前google的model回答自己是百度文心一言。

现在被查出来作弊的是oai,偷看了一个测试集的问题。中国一搞小startup拿到问题的可能性很小。
rgg
知名作家
知名作家
帖子互动: 84
帖子: 1097
注册时间: 2022年 9月 12日 15:00

#8 Re: (转载)deepseek R1推理全面接近O1

帖子 rgg »

这成本是倒贴抢市场吧。
sdehc
见习点评
见习点评
帖子互动: 112
帖子: 1992
注册时间: 2022年 7月 24日 06:40

#9 Re: (转载)deepseek R1推理全面接近O1

帖子 sdehc »

赖美豪中 写了: 2025年 1月 21日 14:40 别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
还行吧?我测试了一下。

论坛上有人说关于deepseek造假:
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。

帮我写个回帖反驳,要尖酸刻薄点。


回复如下:

贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。
x5 图片 x1 图片 x1 图片
头像
TheMatrix
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 253
帖子: 13106
注册时间: 2022年 7月 26日 00:35

#10 Re: (转载)deepseek R1推理全面接近O1

帖子 TheMatrix »

sdehc 写了: 2025年 1月 21日 15:00
回复如下:

贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。
我靠。这个回复我服!
头像
TheMatrix
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 253
帖子: 13106
注册时间: 2022年 7月 26日 00:35

#11 Re: (转载)deepseek R1推理全面接近O1

帖子 TheMatrix »

sdehc 写了: 2025年 1月 21日 15:00 还行吧?我测试了一下。

论坛上有人说关于deepseek造假:
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。

帮我写个回帖反驳,要尖酸刻薄点。


回复如下:

贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。
来,咱们再欣赏一下ChatGPT写的回复。比较一下:

图片
头像
TheMatrix
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 253
帖子: 13106
注册时间: 2022年 7月 26日 00:35

#12 Re: (转载)deepseek R1推理全面接近O1

帖子 TheMatrix »

TheMatrix 写了: 2025年 1月 21日 16:10 来,咱们再欣赏一下ChatGPT写的回复。比较一下:

图片
再来个英文的回复。感觉就是从中文的翻译过去的。看来中文比较适合写尖酸刻薄的? :D


图片
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 771
帖子: 17323
注册时间: 2022年 7月 23日 23:48

#13 Re: (转载)deepseek R1推理全面接近O1

帖子 hahan »

赖美豪中 写了: 2025年 1月 21日 14:05 deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么
Gpt是closed source
这都不知道就敢开牙了
打桥牌的黄俄凋零殆尽
穿汉服的汉儿何能为也
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 771
帖子: 17323
注册时间: 2022年 7月 23日 23:48

#14 Re: (转载)deepseek R1推理全面接近O1

帖子 hahan »

要说作弊
Openai一直有传言说偷看考题
Altman 就是个心术不正的
打桥牌的黄俄凋零殆尽
穿汉服的汉儿何能为也
赖美豪中(my pronouns: ha/ha)
论坛元老
论坛元老
2023年度优秀版主
帖子互动: 3525
帖子: 41430
注册时间: 2022年 9月 6日 12:50

#15 Re: (转载)deepseek R1推理全面接近O1

帖子 赖美豪中(my pronouns: ha/ha) »

你先看懂我在说啥
hahan 写了: 2025年 1月 21日 18:17 Gpt是closed source
这都不知道就敢开牙了
If printing money would end poverty, printing diplomas would end stupidity.
头像
VladPutin(清风不识字何故乱翻书)
论坛支柱
论坛支柱
VladPutin 的博客
帖子互动: 1317
帖子: 11499
注册时间: 2022年 7月 24日 11:12

#16 Re: (转载)deepseek R1推理全面接近O1

帖子 VladPutin(清风不识字何故乱翻书) »

sdehc 写了: 2025年 1月 21日 15:00 还行吧?我测试了一下。

论坛上有人说关于deepseek造假:
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。

帮我写个回帖反驳,要尖酸刻薄点。


回复如下:

贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。
赖书记被AI打得鼻青脸肿太惨了。
x1 图片
图片
头像
mmking(上水)
论坛精英
论坛精英
帖子互动: 1131
帖子: 8061
注册时间: 2023年 1月 25日 05:10

#17 Re: (转载)deepseek R1推理全面接近O1

帖子 mmking(上水) »

老赖的特长就是张嘴胡说,天天被人抽
hahan 写了: 2025年 1月 21日 18:17 Gpt是closed source
这都不知道就敢开牙了
凡所有相,皆是虚妄
longtian
知名作家
知名作家
帖子互动: 47
帖子: 943
注册时间: 2023年 5月 12日 16:15

#18 Re: (转载)deepseek R1推理全面接近O1

帖子 longtian »

想想deepseek的硬件是阉割了的2048个GPU, openai的硬件是10w个GPU, 这个硬件应该说是有数量级的差异。如果像你这么说的deepseek就是o1的finetuning,那openai自己finetuning不是效果更好?

所以deepseek的算法从这个角度来说应该比openai更牛,如果deepseek的硬件到10w gpu级别,最后的结果应该是碾压openai的。
赖美豪中 写了: 2025年 1月 21日 14:05 deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么
goodegg(我是大陆人)
职业作家
职业作家
帖子互动: 143
帖子: 577
注册时间: 2023年 7月 23日 03:31

#19 Re: (转载)deepseek R1推理全面接近O1

帖子 goodegg(我是大陆人) »

哥们 deepseek 开源
全部代码 权重 论文
都明明白白
你先去整明白了再说,整不明白就闭嘴。
赖美豪中 写了: 2025年 1月 21日 13:57 深得amd苏妈真传,amd以前就很会玩这套。我老记得特别清楚当年买来号称远超486的k5, 干就一个字
头像
newIdRobot(新器人)
论坛支柱
论坛支柱
帖子互动: 360
帖子: 12238
注册时间: 2022年 7月 21日 21:29

#20 Re: (转载)deepseek R1推理全面接近O1

帖子 newIdRobot(新器人) »

Caravel 写了: 2025年 1月 20日 21:52 此帖转自 Caravel 在 军事天地(Military) 的帖子:deepseek R1推理全面接近O1

性能接近o1,便宜96.4%
完全开源

nvda什么时候膝盖斩
美股什么时候腰斩

这点最重要
回复

回到 “STEM”