分页: 1 / 1

#1 DeepSeek R1的代码没有公开啊!

发表于 : 2025年 2月 4日 01:11
DonnieTrump
Github上只有之前的代码,类似openai的GPT,只放了低版本。

还是说之前放出来然后又删了?

#2 Re: DeepSeek R1的代码没有公开啊!

发表于 : 2025年 2月 4日 01:41
redot
人家美国都复现了-公司和大学,你没拿到,不等于没公开

#3 Re: DeepSeek R1的代码没有公开啊!

发表于 : 2025年 2月 4日 02:36
waterflow
公开了R1的详细算法,和R1模型,以及调用代码,可以方便在本地运行,但没有公开生成和训练模型代码。

其他公司可以按算法重写,并对任一个基本大模型,加上推理功能(象R1一样)。

#4 Re: DeepSeek R1的代码没有公开啊!

发表于 : 2025年 2月 4日 02:40
xiaoju
训练和生成,全世界的代码都是一样的

行规是训练数据不公开,数据使用方式不公开
waterflow 写了: 2025年 2月 4日 02:36 公开了R1的详细算法,和R1模型,以及调用代码,可以方便在本地运行,但没有公开生成和训练模型代码。

其他公司可以按算法重写,并对任一个基本大模型,加上推理功能(象R1一样)。

#6 Re: DeepSeek R1的代码没有公开啊!

发表于 : 2025年 2月 4日 02:56
DonnieTrump
redot 写了: 2025年 2月 4日 01:41 人家美国都复现了-公司和大学,你没拿到,不等于没公开
只开了模型给抱脸,没有像v1v3那样完全放出来源代码。

拿奥拉马跑模型没问题。

#7 Re: DeepSeek R1的代码没有公开啊!

发表于 : 2025年 2月 4日 03:12
xiaoju
上huggingface上看看去吧。。。
DonnieTrump 写了: 2025年 2月 4日 02:56 只开了模型给抱脸,没有像v1v3那样完全放出来源代码。

拿奥拉马跑模型没问题。

#8 Re: DeepSeek R1的代码没有公开啊!

发表于 : 2025年 2月 4日 03:16
saibaster
哈哈哈哈

DonnieTrump 写了: 2025年 2月 4日 02:56 只开了模型给抱脸,没有像v1v3那样完全放出来源代码。

拿奥拉马跑模型没问题。

#9 Re: DeepSeek R1的代码没有公开啊!

发表于 : 2025年 2月 4日 03:39
DonnieTrump
xiaoju 写了: 2025年 2月 4日 03:12 上huggingface上看看去吧。。。
这个是完全的代码?那几个model...文件是啥?5G左右,既不像模型又不像数据。
https://huggingface.co/deepseek-ai/Deep ... /tree/main

#10 Re: DeepSeek R1的代码没有公开啊!

发表于 : 2025年 2月 4日 03:50
xiaoju
包含了模型的结构,超参数和权重

使用huggingface的库,直接下载就能跑

这种格式是LLM行业标准
DonnieTrump 写了: 2025年 2月 4日 03:39 这个是完全的代码?那几个model...文件是啥?5G左右,既不像模型又不像数据。
https://huggingface.co/deepseek-ai/Deep ... /tree/main

#11 Re: DeepSeek R1的代码没有公开啊!

发表于 : 2025年 2月 4日 03:51
DonnieTrump
xiaoju 写了: 2025年 2月 4日 03:50 包含了模型的结构,超参数和权重

使用huggingface的库,直接下载就能跑

这种格式是LLM行业标准
还要下载抱脸的库才能跑?不是奥拉码直接跑?

#12 Re: DeepSeek R1的代码没有公开啊!

发表于 : 2025年 2月 4日 04:03
coltzhao
就是和奥拉码上一样的。