DeepSeek’s new AI model is more than a Sputnik moment

统计/生物统计/精算/数据科学/机器学习(含深度学习和强化学习)
本版讨论各种专业问题,相关职业问题,转专业问题,以及机器学习在各个学科的应用。
回复
头像
SOD楼主
论坛元老
论坛元老
SOD 的博客
帖子互动: 1299
帖子: 25348
注册时间: 2022年 7月 23日 22:53

#1 DeepSeek’s new AI model is more than a Sputnik moment

帖子 SOD楼主 »



此生无悔入华夏,家住加利福利亚

图片
头像
SOD楼主
论坛元老
论坛元老
SOD 的博客
帖子互动: 1299
帖子: 25348
注册时间: 2022年 7月 23日 22:53

#2 Re: DeepSeek’s new AI model is more than a Sputnik moment

帖子 SOD楼主 »

DeepSeek创造历史 超越OpenAI狂揽7.8万星
2025年02月07日 18:18 293 次阅读 稿源:智东西 0 条评论
AI 人工智能
刚刚,DeepSeek在开源社区GitHub上的Star数首次超越Open AI。DeepSeek-V3的Star数为7.78万,OpenAI项目中,Star数最高的是实时音频转文本模型Whisper的,为7.57万。DeepSeek-R1的Star数也超过OpenAI其他项目,达到6.59万。openai-cookbook为OpenAI Star数第二高的项目6.15万,该项目是提供使用OpenAI示例代码和指南的官方开源项目。

这也是DeepSeek力压ChatGPT登顶美区App Store免费榜,在国内App Store免费榜同样位居第一后,创下的又一个历史时刻。



▲DeepSeek开源项目(左)、OpenAI开源项目(右)(图源:GitHub)


在一众开源模型玩家中,DeepSeek的Star数也远超其他模型。

Meta的Llama系列模型中,2023年推出的开源模型Llama最高为5.75万,Llama 3次之为2.82万;阿里云通义千问的开源模型中,1月29日发布的Qwen2.5的Star数最高,达到1.49万;零一万物的Yi为7800;Anthropic的热门项目Anthropic-cookbook Star数为1.02万,该项目是提供样例实现参考的开源项目。

DeepSeek V3和DeepSeek R1分别于2024年12月26日和今年1月20日发布。

DeepSeek V3为DeepSeek自研MoE模型,参数量达到671B,激活参数量37B,在14.8T token上进行了预训练,该模型在多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并在性能上和闭源模型GPT-4o以及Claude-3.5-Sonnet比肩。

DeepSeek R1在数学、代码、自然语言推理等任务上,性能比肩Open AI o1正式版,在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,蒸馏了6个小模型,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。

当下,全球已经掀起了从芯片企业、云计算巨头到各路基础设施公司适配、接入DeepSeek的热潮,DeepSeek所展现出的卓越性能与广泛的应用潜力正在逐渐放大。
此生无悔入华夏,家住加利福利亚

图片
回复

回到 “统计与数据科学(Statistics & DataScience)”