分页: 1 / 1
#1 DeepSeek R1的代码没有公开啊!
发表于 : 2025年 2月 4日 01:11
由 DonnieTrump
Github上只有之前的代码,类似openai的GPT,只放了低版本。
还是说之前放出来然后又删了?
#2 Re: DeepSeek R1的代码没有公开啊!
发表于 : 2025年 2月 4日 01:41
由 redot
人家美国都复现了-公司和大学,你没拿到,不等于没公开
#3 Re: DeepSeek R1的代码没有公开啊!
发表于 : 2025年 2月 4日 02:36
由 waterflow
公开了R1的详细算法,和R1模型,以及调用代码,可以方便在本地运行,但没有公开生成和训练模型代码。
其他公司可以按算法重写,并对任一个基本大模型,加上推理功能(象R1一样)。
#4 Re: DeepSeek R1的代码没有公开啊!
发表于 : 2025年 2月 4日 02:40
由 xiaoju
训练和生成,全世界的代码都是一样的
行规是训练数据不公开,数据使用方式不公开
waterflow 写了: 2025年 2月 4日 02:36
公开了R1的详细算法,和R1模型,以及调用代码,可以方便在本地运行,但没有公开生成和训练模型代码。
其他公司可以按算法重写,并对任一个基本大模型,加上推理功能(象R1一样)。
#6 Re: DeepSeek R1的代码没有公开啊!
发表于 : 2025年 2月 4日 02:56
由 DonnieTrump
redot 写了: 2025年 2月 4日 01:41
人家美国都复现了-公司和大学,你没拿到,不等于没公开
只开了模型给抱脸,没有像v1v3那样完全放出来源代码。
拿奥拉马跑模型没问题。
#7 Re: DeepSeek R1的代码没有公开啊!
发表于 : 2025年 2月 4日 03:12
由 xiaoju
上huggingface上看看去吧。。。
DonnieTrump 写了: 2025年 2月 4日 02:56
只开了模型给抱脸,没有像v1v3那样完全放出来源代码。
拿奥拉马跑模型没问题。
#8 Re: DeepSeek R1的代码没有公开啊!
发表于 : 2025年 2月 4日 03:16
由 saibaster
哈哈哈哈
DonnieTrump 写了: 2025年 2月 4日 02:56
只开了模型给抱脸,没有像v1v3那样完全放出来源代码。
拿奥拉马跑模型没问题。
#9 Re: DeepSeek R1的代码没有公开啊!
发表于 : 2025年 2月 4日 03:39
由 DonnieTrump
xiaoju 写了: 2025年 2月 4日 03:12
上huggingface上看看去吧。。。
这个是完全的代码?那几个model...文件是啥?5G左右,既不像模型又不像数据。
https://huggingface.co/deepseek-ai/Deep ... /tree/main
#10 Re: DeepSeek R1的代码没有公开啊!
发表于 : 2025年 2月 4日 03:50
由 xiaoju
包含了模型的结构,超参数和权重
使用huggingface的库,直接下载就能跑
这种格式是LLM行业标准
#11 Re: DeepSeek R1的代码没有公开啊!
发表于 : 2025年 2月 4日 03:51
由 DonnieTrump
xiaoju 写了: 2025年 2月 4日 03:50
包含了模型的结构,超参数和权重
使用huggingface的库,直接下载就能跑
这种格式是LLM行业标准
还要下载抱脸的库才能跑?不是奥拉码直接跑?
#12 Re: DeepSeek R1的代码没有公开啊!
发表于 : 2025年 2月 4日 04:03
由 coltzhao
就是和奥拉码上一样的。