DeepSeek’s new AI model is more than a Sputnik moment - 新未名空间

DeepSeek’s new AI model is more than a Sputnik moment

回复

2 帖子 • 分页： 1 / 1

SOD楼主: 论坛元老

SOD 的博客; 帖子互动： 1384; 帖子： 26200; 注册时间： 2022年 7月 23日 22:53

#1 DeepSeek’s new AI model is more than a Sputnik moment

引用

帖子由 SOD楼主 » 2025年 2月 7日 11:49

此生无悔入华夏，家住加利福利亚

SOD楼主: 论坛元老

SOD 的博客; 帖子互动： 1384; 帖子： 26200; 注册时间： 2022年 7月 23日 22:53

#2 Re: DeepSeek’s new AI model is more than a Sputnik moment

引用

帖子由 SOD楼主 » 2025年 2月 8日 01:00

DeepSeek创造历史超越OpenAI狂揽7.8万星
2025年02月07日 18:18 293 次阅读稿源：智东西 0 条评论
AI 人工智能
刚刚，DeepSeek在开源社区GitHub上的Star数首次超越Open AI。DeepSeek-V3的Star数为7.78万，OpenAI项目中，Star数最高的是实时音频转文本模型Whisper的，为7.57万。DeepSeek-R1的Star数也超过OpenAI其他项目，达到6.59万。openai-cookbook为OpenAI Star数第二高的项目6.15万，该项目是提供使用OpenAI示例代码和指南的官方开源项目。

这也是DeepSeek力压ChatGPT登顶美区App Store免费榜，在国内App Store免费榜同样位居第一后，创下的又一个历史时刻。

▲DeepSeek开源项目（左）、OpenAI开源项目（右）（图源：GitHub）

在一众开源模型玩家中，DeepSeek的Star数也远超其他模型。

Meta的Llama系列模型中，2023年推出的开源模型Llama最高为5.75万，Llama 3次之为2.82万；阿里云通义千问的开源模型中，1月29日发布的Qwen2.5的Star数最高，达到1.49万；零一万物的Yi为7800；Anthropic的热门项目Anthropic-cookbook Star数为1.02万，该项目是提供样例实现参考的开源项目。

DeepSeek V3和DeepSeek R1分别于2024年12月26日和今年1月20日发布。

DeepSeek V3为DeepSeek自研MoE模型，参数量达到671B，激活参数量37B，在14.8T token上进行了预训练，该模型在多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等开源模型，并在性能上和闭源模型GPT-4o以及Claude-3.5-Sonnet比肩。

DeepSeek R1在数学、代码、自然语言推理等任务上，性能比肩Open AI o1正式版，在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时，蒸馏了6个小模型，其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。

当下，全球已经掀起了从芯片企业、云计算巨头到各路基础设施公司适配、接入DeepSeek的热潮，DeepSeek所展现出的卓越性能与广泛的应用潜力正在逐渐放大。

此生无悔入华夏，家住加利福利亚

回复

2 帖子 • 分页： 1 / 1

回到 “统计与数据科学（Statistics & DataScience）”

Do not share my Personal Information.

底部广告