分页: 1 / 2
#1 (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 20日 21:52
由 Caravel
此帖转自 Caravel 在
军事天地(Military) 的帖子:
deepseek R1推理全面接近O1
性能接近o1,便宜96.4%
完全开源
#2 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 13:57
由 赖美豪中
深得amd苏妈真传,amd以前就很会玩这套。我老记得特别清楚当年买来号称远超486的k5, 干就一个字
#3 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 14:02
由 Caravel
赖美豪中 写了: 2025年 1月 21日 13:57
深得amd苏妈真传,amd以前就很会玩这套。我老记得特别清楚当年买来号称远超486的k5, 干就一个字
要说作假,openai作假可能性更大
R1是全开源,oAI的很多model都没法测试
现在很多人可以自己跑R1,效果不错
#4 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 14:05
由 赖美豪中
deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么
Caravel 写了: 2025年 1月 21日 14:02
要说作假,openai作假可能性更大
R1是全开源,oAI的很多model都没法测试
现在很多人可以自己跑R1,效果不错
#5 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 14:18
由 Caravel
赖美豪中 写了: 2025年 1月 21日 14:05
deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么
没那么简单,o1出来半年了吧,如果按照你说的简单,那随便一个公司就应该做出o1级别的?
他们论文提到了没有人工标注数据的强化学习,就像alphazero一样self play。
#6 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 14:40
由 赖美豪中
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
Caravel 写了: 2025年 1月 21日 14:18
没那么简单,o1出来半年了吧,如果按照你说的简单,那随便一个公司就应该做出o1级别的?
他们论文提到了没有人工标注数据的强化学习,就像alphazero一样self play。
#7 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 14:45
由 Caravel
赖美豪中 写了: 2025年 1月 21日 14:40
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
用别的model生成数据是通行做法,以前google的model回答自己是百度文心一言。
现在被查出来作弊的是oai,偷看了一个测试集的问题。中国一搞小startup拿到问题的可能性很小。
#8 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 14:56
由 rgg
这成本是倒贴抢市场吧。
#9 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 15:00
由 sdehc
赖美豪中 写了: 2025年 1月 21日 14:40
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
还行吧?我测试了一下。
论坛上有人说关于deepseek造假:
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
帮我写个回帖反驳,要尖酸刻薄点。
回复如下:
贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。
#10 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 16:08
由 TheMatrix
sdehc 写了: 2025年 1月 21日 15:00
回复如下:
贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。
我靠。这个回复我服!
#11 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 16:10
由 TheMatrix
sdehc 写了: 2025年 1月 21日 15:00
还行吧?我测试了一下。
论坛上有人说关于deepseek造假:
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
帮我写个回帖反驳,要尖酸刻薄点。
回复如下:
贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。
来,咱们再欣赏一下ChatGPT写的回复。比较一下:

#12 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 16:15
由 TheMatrix
TheMatrix 写了: 2025年 1月 21日 16:10
来,咱们再欣赏一下ChatGPT写的回复。比较一下:
再来个英文的回复。感觉就是从中文的翻译过去的。看来中文比较适合写尖酸刻薄的?

#13 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 18:17
由 hahan
赖美豪中 写了: 2025年 1月 21日 14:05
deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么
Gpt是closed source
这都不知道就敢开牙了
#14 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 18:19
由 hahan
要说作弊
Openai一直有传言说偷看考题
Altman 就是个心术不正的
#15 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 18:30
由 赖美豪中
你先看懂我在说啥
hahan 写了: 2025年 1月 21日 18:17
Gpt是closed source
这都不知道就敢开牙了
#16 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 20:20
由 VladPutin
sdehc 写了: 2025年 1月 21日 15:00
还行吧?我测试了一下。
论坛上有人说关于deepseek造假:
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
帮我写个回帖反驳,要尖酸刻薄点。
回复如下:
贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。
赖书记被AI打得鼻青脸肿太惨了。
#17 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 21日 23:20
由 mmking
老赖的特长就是张嘴胡说,天天被人抽
hahan 写了: 2025年 1月 21日 18:17
Gpt是closed source
这都不知道就敢开牙了
#18 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 22日 00:43
由 longtian
想想deepseek的硬件是阉割了的2048个GPU, openai的硬件是10w个GPU, 这个硬件应该说是有数量级的差异。如果像你这么说的deepseek就是o1的finetuning,那openai自己finetuning不是效果更好?
所以deepseek的算法从这个角度来说应该比openai更牛,如果deepseek的硬件到10w gpu级别,最后的结果应该是碾压openai的。
赖美豪中 写了: 2025年 1月 21日 14:05
deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么
#19 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 22日 06:28
由 goodegg
哥们 deepseek 开源
全部代码 权重 论文
都明明白白
你先去整明白了再说,整不明白就闭嘴。
赖美豪中 写了: 2025年 1月 21日 13:57
深得amd苏妈真传,amd以前就很会玩这套。我老记得特别清楚当年买来号称远超486的k5, 干就一个字
#20 Re: (转载)deepseek R1推理全面接近O1
发表于 : 2025年 1月 22日 06:33
由 newIdRobot
nvda什么时候膝盖斩
美股什么时候腰斩
这点最重要