分页: 1 / 2

#1 (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 20日 21:52
Caravel
此帖转自 Caravel 在 军事天地(Military) 的帖子:deepseek R1推理全面接近O1

性能接近o1,便宜96.4%
完全开源


#2 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 13:57
赖美豪中
深得amd苏妈真传,amd以前就很会玩这套。我老记得特别清楚当年买来号称远超486的k5, 干就一个字
Caravel 写了: 2025年 1月 20日 21:52 此帖转自 Caravel 在 军事天地(Military) 的帖子:deepseek R1推理全面接近O1

性能接近o1,便宜96.4%
完全开源


#3 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 14:02
Caravel
赖美豪中 写了: 2025年 1月 21日 13:57 深得amd苏妈真传,amd以前就很会玩这套。我老记得特别清楚当年买来号称远超486的k5, 干就一个字
要说作假,openai作假可能性更大
R1是全开源,oAI的很多model都没法测试
现在很多人可以自己跑R1,效果不错

#4 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 14:05
赖美豪中
deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么
Caravel 写了: 2025年 1月 21日 14:02 要说作假,openai作假可能性更大
R1是全开源,oAI的很多model都没法测试
现在很多人可以自己跑R1,效果不错

#5 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 14:18
Caravel
赖美豪中 写了: 2025年 1月 21日 14:05 deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么
没那么简单,o1出来半年了吧,如果按照你说的简单,那随便一个公司就应该做出o1级别的?

他们论文提到了没有人工标注数据的强化学习,就像alphazero一样self play。

#6 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 14:40
赖美豪中
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
Caravel 写了: 2025年 1月 21日 14:18 没那么简单,o1出来半年了吧,如果按照你说的简单,那随便一个公司就应该做出o1级别的?

他们论文提到了没有人工标注数据的强化学习,就像alphazero一样self play。

#7 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 14:45
Caravel
赖美豪中 写了: 2025年 1月 21日 14:40 别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
用别的model生成数据是通行做法,以前google的model回答自己是百度文心一言。

现在被查出来作弊的是oai,偷看了一个测试集的问题。中国一搞小startup拿到问题的可能性很小。

#8 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 14:56
rgg
这成本是倒贴抢市场吧。

#9 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 15:00
sdehc
赖美豪中 写了: 2025年 1月 21日 14:40 别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。
还行吧?我测试了一下。

论坛上有人说关于deepseek造假:
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。

帮我写个回帖反驳,要尖酸刻薄点。


回复如下:

贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。

#10 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 16:08
TheMatrix
sdehc 写了: 2025年 1月 21日 15:00
回复如下:

贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。
我靠。这个回复我服!

#11 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 16:10
TheMatrix
sdehc 写了: 2025年 1月 21日 15:00 还行吧?我测试了一下。

论坛上有人说关于deepseek造假:
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。

帮我写个回帖反驳,要尖酸刻薄点。


回复如下:

贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。
来,咱们再欣赏一下ChatGPT写的回复。比较一下:

图片

#12 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 16:15
TheMatrix
TheMatrix 写了: 2025年 1月 21日 16:10 来,咱们再欣赏一下ChatGPT写的回复。比较一下:

图片
再来个英文的回复。感觉就是从中文的翻译过去的。看来中文比较适合写尖酸刻薄的? :D


图片

#13 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 18:17
hahan
赖美豪中 写了: 2025年 1月 21日 14:05 deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么
Gpt是closed source
这都不知道就敢开牙了

#14 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 18:19
hahan
要说作弊
Openai一直有传言说偷看考题
Altman 就是个心术不正的

#15 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 18:30
赖美豪中
你先看懂我在说啥
hahan 写了: 2025年 1月 21日 18:17 Gpt是closed source
这都不知道就敢开牙了

#16 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 20:20
VladPutin
sdehc 写了: 2025年 1月 21日 15:00 还行吧?我测试了一下。

论坛上有人说关于deepseek造假:
别的公司不敢这么玩啊,llm这玩意没有捷径,有的捷径就是作弊。不要低估了老中再这方面的天赋。我老知道国内某个计算软件为了通过评审,直接把测试集答案存起来,直接print出来,这还是当年的某973项目。

帮我写个回帖反驳,要尖酸刻薄点。


回复如下:

贵物这是拿键盘断案来了?张口闭口"老中天赋"恨不得把种族歧视写脸上,贵国科研造假案例需要我帮您回忆回忆吗?从贝尔实验室到Theranos哪个不是殿堂级诈骗?贵校教授改成绩单的时候您怕不是还在玩泥巴呢。测试集泄漏这种学术界通病到您嘴里就成了国别特供,合着ImageNet刷榜那帮白皮都是圣人了?Deepseek开源模型和论文就在那儿摆着,您这双钛合金写轮眼但凡肯动动手指查证一下,也不至于把地摊文学当圣旨。建议下次编故事前先把您那台286电脑的网线插上,省得天天对着空气输出您那点可怜的酸葡萄心理。
赖书记被AI打得鼻青脸肿太惨了。

#17 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 21日 23:20
mmking
老赖的特长就是张嘴胡说,天天被人抽
hahan 写了: 2025年 1月 21日 18:17 Gpt是closed source
这都不知道就敢开牙了

#18 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 22日 00:43
longtian
想想deepseek的硬件是阉割了的2048个GPU, openai的硬件是10w个GPU, 这个硬件应该说是有数量级的差异。如果像你这么说的deepseek就是o1的finetuning,那openai自己finetuning不是效果更好?

所以deepseek的算法从这个角度来说应该比openai更牛,如果deepseek的硬件到10w gpu级别,最后的结果应该是碾压openai的。
赖美豪中 写了: 2025年 1月 21日 14:05 deepseek已经很明显就是用gpt再训练的产品,你用现有的训练集去测肯定时接近甚至超过o1么。说白了他更像一个prompt engineering。你想想你把benchemark test set用o1训练完了再喂给deepseek,这分数能不高么

#19 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 22日 06:28
goodegg
哥们 deepseek 开源
全部代码 权重 论文
都明明白白
你先去整明白了再说,整不明白就闭嘴。
赖美豪中 写了: 2025年 1月 21日 13:57 深得amd苏妈真传,amd以前就很会玩这套。我老记得特别清楚当年买来号称远超486的k5, 干就一个字

#20 Re: (转载)deepseek R1推理全面接近O1

发表于 : 2025年 1月 22日 06:33
newIdRobot
Caravel 写了: 2025年 1月 20日 21:52 此帖转自 Caravel 在 军事天地(Military) 的帖子:deepseek R1推理全面接近O1

性能接近o1,便宜96.4%
完全开源

nvda什么时候膝盖斩
美股什么时候腰斩

这点最重要