(转载)deepseek R1推理全面接近O1
版主: verdelite, TheMatrix
-
- 论坛元老
Caravel 的博客 - 帖子互动: 513
- 帖子: 23543
- 注册时间: 2022年 7月 24日 17:21
#2 Re: (转载)deepseek R1推理全面接近O1
深得amd苏妈真传,amd以前就很会玩这套。我老记得特别清楚当年买来号称远超486的k5, 干就一个字
Caravel 写了: 2025年 1月 20日 21:52 此帖转自 Caravel 在 军事天地(Military) 的帖子:deepseek R1推理全面接近O1
性能接近o1,便宜96.4%
完全开源
If printing money would end poverty, printing diplomas would end stupidity.
-
- 论坛元老
Caravel 的博客 - 帖子互动: 513
- 帖子: 23543
- 注册时间: 2022年 7月 24日 17:21
#4 Re: (转载)deepseek R1推理全面接近O1
deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么
If printing money would end poverty, printing diplomas would end stupidity.
-
- 论坛元老
Caravel 的博客 - 帖子互动: 513
- 帖子: 23543
- 注册时间: 2022年 7月 24日 17:21
#5 Re: (转载)deepseek R1推理全面接近O1
没那么简单,o1出来半年了吧,如果按照你说的简单,那随便一个公司就应该做出o1级别的?赖美豪中 写了: 2025年 1月 21日 14:05 deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么
他们论文提到了没有人工标注数据的强化学习,就像alphazero一样self play。
#6 Re: (转载)deepseek R1推理全面接近O1
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
Caravel 写了: 2025年 1月 21日 14:18 没那么简单,o1出来半年了吧,如果按照你说的简单,那随便一个公司就应该做出o1级别的?
他们论文提到了没有人工标注数据的强化学习,就像alphazero一样self play。
If printing money would end poverty, printing diplomas would end stupidity.
-
- 论坛元老
Caravel 的博客 - 帖子互动: 513
- 帖子: 23543
- 注册时间: 2022年 7月 24日 17:21
#7 Re: (转载)deepseek R1推理全面接近O1
用别的model生成数据是通行做法,以前google的model回答自己是百度文心一言。赖美豪中 写了: 2025年 1月 21日 14:40 别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
现在被查出来作弊的是oai,偷看了一个测试集的问题。中国一搞小startup拿到问题的可能性很小。
#9 Re: (转载)deepseek R1推理全面接近O1
还行吧?我测试了一下。赖美豪中 写了: 2025年 1月 21日 14:40 别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
论坛上有人说关于deepseek造假:
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
帮我写个回帖反驳,要尖酸刻薄点。
回复如下:
贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。
x5
x1
x1



-
- 论坛支柱
2024年度优秀版主
TheMatrix 的博客 - 帖子互动: 253
- 帖子: 13106
- 注册时间: 2022年 7月 26日 00:35
#10 Re: (转载)deepseek R1推理全面接近O1
我靠。这个回复我服!sdehc 写了: 2025年 1月 21日 15:00
回复如下:
贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。
-
- 论坛支柱
2024年度优秀版主
TheMatrix 的博客 - 帖子互动: 253
- 帖子: 13106
- 注册时间: 2022年 7月 26日 00:35
#11 Re: (转载)deepseek R1推理全面接近O1
来,咱们再欣赏一下ChatGPT写的回复。比较一下:sdehc 写了: 2025年 1月 21日 15:00 还行吧?我测试了一下。
论坛上有人说关于deepseek造假:
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
帮我写个回帖反驳,要尖酸刻薄点。
回复如下:
贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。

-
- 论坛支柱
2024年度优秀版主
TheMatrix 的博客 - 帖子互动: 253
- 帖子: 13106
- 注册时间: 2022年 7月 26日 00:35
#13 Re: (转载)deepseek R1推理全面接近O1
Gpt是closed source赖美豪中 写了: 2025年 1月 21日 14:05 deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么
这都不知道就敢开牙了
打桥牌的黄俄凋零殆尽
穿汉服的汉儿何能为也
穿汉服的汉儿何能为也
#15 Re: (转载)deepseek R1推理全面接近O1
你先看懂我在说啥
If printing money would end poverty, printing diplomas would end stupidity.
-
- 论坛支柱
VladPutin 的博客 - 帖子互动: 1317
- 帖子: 11499
- 注册时间: 2022年 7月 24日 11:12
#16 Re: (转载)deepseek R1推理全面接近O1
赖书记被AI打得鼻青脸肿太惨了。sdehc 写了: 2025年 1月 21日 15:00 还行吧?我测试了一下。
论坛上有人说关于deepseek造假:
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
帮我写个回帖反驳,要尖酸刻薄点。
回复如下:
贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。
x1


#18 Re: (转载)deepseek R1推理全面接近O1
想想deepseek的硬件是阉割了的2048个GPU, openai的硬件是10w个GPU, 这个硬件应该说是有数量级的差异。如果像你这么说的deepseek就是o1的finetuning,那openai自己finetuning不是效果更好?
所以deepseek的算法从这个角度来说应该比openai更牛,如果deepseek的硬件到10w gpu级别,最后的结果应该是碾压openai的。
所以deepseek的算法从这个角度来说应该比openai更牛,如果deepseek的硬件到10w gpu级别,最后的结果应该是碾压openai的。
赖美豪中 写了: 2025年 1月 21日 14:05 deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么
#20 Re: (转载)deepseek R1推理全面接近O1
nvda什么时候膝盖斩Caravel 写了: 2025年 1月 20日 21:52 此帖转自 Caravel 在 军事天地(Military) 的帖子:deepseek R1推理全面接近O1
性能接近o1,便宜96.4%
完全开源
美股什么时候腰斩
这点最重要