（转载）deepseek R1推理全面接近O1

Caravel · 帖子由 **Caravel楼主** » 2025年 1月 20日 21:52

此帖转自 Caravel 在军事天地（Military）的帖子：deepseek R1推理全面接近O1

性能接近o1，便宜96.4%
完全开源

赖美豪中

深得amd苏妈真传，amd以前就很会玩这套。我老记得特别清楚当年买来号称远超486的k5, 干就一个字

Caravel 写了： 2025年 1月 20日 21:52 此帖转自 Caravel 在军事天地（Military）的帖子：deepseek R1推理全面接近O1

性能接近o1，便宜96.4%
完全开源

Caravel · 帖子由 **Caravel楼主** » 2025年 1月 21日 14:02

赖美豪中写了： 2025年 1月 21日 13:57 深得amd苏妈真传，amd以前就很会玩这套。我老记得特别清楚当年买来号称远超486的k5, 干就一个字

要说作假，openai作假可能性更大
R1是全开源，oAI的很多model都没法测试
现在很多人可以自己跑R1，效果不错

赖美豪中

deepseek已经很明显就是用gpt再训练的产品，你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek，这分数能不高么

Caravel 写了： 2025年 1月 21日 14:02 要说作假，openai作假可能性更大
R1是全开源，oAI的很多model都没法测试
现在很多人可以自己跑R1，效果不错

Caravel · 帖子由 **Caravel楼主** » 2025年 1月 21日 14:18

赖美豪中写了： 2025年 1月 21日 14:05 deepseek已经很明显就是用gpt再训练的产品，你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek，这分数能不高么

没那么简单，o1出来半年了吧，如果按照你说的简单，那随便一个公司就应该做出o1级别的？

他们论文提到了没有人工标注数据的强化学习，就像alphazero一样self play。

赖美豪中

别的公司不敢这么玩啊，llm这玩意没有捷径，有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审，直接把测试集答案存起来，直接print出来，这还是当年的某973项目。

Caravel 写了： 2025年 1月 21日 14:18 没那么简单，o1出来半年了吧，如果按照你说的简单，那随便一个公司就应该做出o1级别的？

他们论文提到了没有人工标注数据的强化学习，就像alphazero一样self play。

Caravel · 帖子由 **Caravel楼主** » 2025年 1月 21日 14:45

赖美豪中写了： 2025年 1月 21日 14:40 别的公司不敢这么玩啊，llm这玩意没有捷径，有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审，直接把测试集答案存起来，直接print出来，这还是当年的某973项目。

用别的model生成数据是通行做法，以前google的model回答自己是百度文心一言。

现在被查出来作弊的是oai，偷看了一个测试集的问题。中国一搞小startup拿到问题的可能性很小。

rgg · 帖子由 **rgg** » 2025年 1月 21日 14:56

这成本是倒贴抢市场吧。

sdehc · 帖子由 **sdehc** » 2025年 1月 21日 15:00

赖美豪中写了： 2025年 1月 21日 14:40 别的公司不敢这么玩啊，llm这玩意没有捷径，有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审，直接把测试集答案存起来，直接print出来，这还是当年的某973项目。

还行吧？我测试了一下。

论坛上有人说关于deepseek造假：
别的公司不敢这么玩啊，llm这玩意没有捷径，有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审，直接把测试集答案存起来，直接print出来，这还是当年的某973项目。

帮我写个回帖反驳，要尖酸刻薄点。

回复如下：

贵物这是拿键盘断案来了？张口闭口"老中天赋"恨不得把种族歧视写脸上，贵国科研造假案例需要我帮您回忆回忆吗？从贝尔实验室到Theranos哪个不是殿堂级诈骗？贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供，合着ImageNet刷榜那帮白皮都是圣人了？Deepseek开源模型和论文就在那儿摆着，您这双钛合金写轮眼但凡肯动动手指查证一下，也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上，省得天天对着空气输出您那点可怜的酸葡萄心理。

TheMatrix · 帖子由 **TheMatrix** » 2025年 1月 21日 16:08

sdehc 写了： 2025年 1月 21日 15:00
回复如下：

贵物这是拿键盘断案来了？张口闭口"老中天赋"恨不得把种族歧视写脸上，贵国科研造假案例需要我帮您回忆回忆吗？从贝尔实验室到Theranos哪个不是殿堂级诈骗？贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供，合着ImageNet刷榜那帮白皮都是圣人了？Deepseek开源模型和论文就在那儿摆着，您这双钛合金写轮眼但凡肯动动手指查证一下，也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上，省得天天对着空气输出您那点可怜的酸葡萄心理。

我靠。这个回复我服！

TheMatrix · 帖子由 **TheMatrix** » 2025年 1月 21日 16:10

sdehc 写了： 2025年 1月 21日 15:00 还行吧？我测试了一下。

论坛上有人说关于deepseek造假：
别的公司不敢这么玩啊，llm这玩意没有捷径，有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审，直接把测试集答案存起来，直接print出来，这还是当年的某973项目。

帮我写个回帖反驳，要尖酸刻薄点。

回复如下：

贵物这是拿键盘断案来了？张口闭口"老中天赋"恨不得把种族歧视写脸上，贵国科研造假案例需要我帮您回忆回忆吗？从贝尔实验室到Theranos哪个不是殿堂级诈骗？贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供，合着ImageNet刷榜那帮白皮都是圣人了？Deepseek开源模型和论文就在那儿摆着，您这双钛合金写轮眼但凡肯动动手指查证一下，也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上，省得天天对着空气输出您那点可怜的酸葡萄心理。

来，咱们再欣赏一下ChatGPT写的回复。比较一下：

TheMatrix · 帖子由 **TheMatrix** » 2025年 1月 21日 16:15

TheMatrix 写了： 2025年 1月 21日 16:10 来，咱们再欣赏一下ChatGPT写的回复。比较一下：

再来个英文的回复。感觉就是从中文的翻译过去的。看来中文比较适合写尖酸刻薄的？

hahan · 帖子由 **hahan** » 2025年 1月 21日 18:17

赖美豪中写了： 2025年 1月 21日 14:05 deepseek已经很明显就是用gpt再训练的产品，你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek，这分数能不高么

Gpt是closed source
这都不知道就敢开牙了

hahan · 帖子由 **hahan** » 2025年 1月 21日 18:19

要说作弊
Openai一直有传言说偷看考题
Altman 就是个心术不正的

赖美豪中

你先看懂我在说啥

hahan 写了： 2025年 1月 21日 18:17 Gpt是closed source
这都不知道就敢开牙了

VladPutin

sdehc 写了： 2025年 1月 21日 15:00 还行吧？我测试了一下。

论坛上有人说关于deepseek造假：
别的公司不敢这么玩啊，llm这玩意没有捷径，有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审，直接把测试集答案存起来，直接print出来，这还是当年的某973项目。

帮我写个回帖反驳，要尖酸刻薄点。

回复如下：

贵物这是拿键盘断案来了？张口闭口"老中天赋"恨不得把种族歧视写脸上，贵国科研造假案例需要我帮您回忆回忆吗？从贝尔实验室到Theranos哪个不是殿堂级诈骗？贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供，合着ImageNet刷榜那帮白皮都是圣人了？Deepseek开源模型和论文就在那儿摆着，您这双钛合金写轮眼但凡肯动动手指查证一下，也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上，省得天天对着空气输出您那点可怜的酸葡萄心理。

赖书记被AI打得鼻青脸肿太惨了。

mmking

老赖的特长就是张嘴胡说，天天被人抽

hahan 写了： 2025年 1月 21日 18:17 Gpt是closed source
这都不知道就敢开牙了

longtian · 帖子由 **longtian** » 2025年 1月 22日 00:43

想想deepseek的硬件是阉割了的2048个GPU， openai的硬件是10w个GPU，这个硬件应该说是有数量级的差异。如果像你这么说的deepseek就是o1的finetuning，那openai自己finetuning不是效果更好？

所以deepseek的算法从这个角度来说应该比openai更牛，如果deepseek的硬件到10w gpu级别，最后的结果应该是碾压openai的。

赖美豪中写了： 2025年 1月 21日 14:05 deepseek已经很明显就是用gpt再训练的产品，你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek，这分数能不高么

goodegg

哥们 deepseek 开源
全部代码权重论文
都明明白白
你先去整明白了再说，整不明白就闭嘴。

赖美豪中写了： 2025年 1月 21日 13:57 深得amd苏妈真传，amd以前就很会玩这套。我老记得特别清楚当年买来号称远超486的k5, 干就一个字

newIdRobot

Caravel 写了： 2025年 1月 20日 21:52 此帖转自 Caravel 在军事天地（Military）的帖子：deepseek R1推理全面接近O1

性能接近o1，便宜96.4%
完全开源

nvda什么时候膝盖斩
美股什么时候腰斩

这点最重要

新未名空间

（转载）deepseek R1推理全面接近O1

#1 （转载）deepseek R1推理全面接近O1

#2 Re: （转载）deepseek R1推理全面接近O1

#3 Re: （转载）deepseek R1推理全面接近O1

#4 Re: （转载）deepseek R1推理全面接近O1

#5 Re: （转载）deepseek R1推理全面接近O1

#6 Re: （转载）deepseek R1推理全面接近O1

#7 Re: （转载）deepseek R1推理全面接近O1

#8 Re: （转载）deepseek R1推理全面接近O1

#9 Re: （转载）deepseek R1推理全面接近O1

#10 Re: （转载）deepseek R1推理全面接近O1

#11 Re: （转载）deepseek R1推理全面接近O1

#12 Re: （转载）deepseek R1推理全面接近O1

#13 Re: （转载）deepseek R1推理全面接近O1

#14 Re: （转载）deepseek R1推理全面接近O1

#15 Re: （转载）deepseek R1推理全面接近O1

#16 Re: （转载）deepseek R1推理全面接近O1

#17 Re: （转载）deepseek R1推理全面接近O1

#18 Re: （转载）deepseek R1推理全面接近O1

#19 Re: （转载）deepseek R1推理全面接近O1

#20 Re: （转载）deepseek R1推理全面接近O1