分页: 1 / 1
#1 DeepSeek R2 还没release... 是不是...🤔
发表于 : 2025年 5月 23日 03:02
由 一紙荒唐
舍不得把干货
白白的Open source 了...

#2 Re: DeepSeek R2 还没release... 是不是...🤔
发表于 : 2025年 5月 23日 03:02
由 一紙荒唐
DeepSeek 也许就有了新的突破... 这几个月!
所以不大情愿白白的免费了
#3 Re: DeepSeek R2 还没release... 是不是...🤔
发表于 : 2025年 5月 23日 04:37
由 魔术强森
一紙荒唐 写了: 2025年 5月 23日 03:02
舍不得把干货
白白的Open source 了...
第一个版本开源秀一下肌肉,后面没必要开源了。OpenAI不是也闭源。
#4 Re: DeepSeek R2 还没release... 是不是...🤔
发表于 : 2025年 5月 23日 04:59
由 zheliemit
deepseek R2的架构做了重大修改,不再用transformer架构了,这个transformaer架构是谷歌用来做翻译软件用的架构,不适合做逻辑推理。
新的LLM架构更牛逼,据说自己能设计数学概念,并自行推理,在测试环境下已经解决了不少物理难题。
#5 Re: DeepSeek R2 还没release... 是不是...🤔
发表于 : 2025年 5月 23日 07:21
由 一紙荒唐
zheliemit 写了: 2025年 5月 23日 04:59
deepseek R2的架构做了重大修改,不再用transformer架构了,这个transformaer架构是谷歌用来做翻译软件用的架构,不适合做逻辑推理。
新的LLM架构更牛逼,据说自己能设计数学概念,并自行推理,在测试环境下已经解决了不少物理难题。
Wow!
#6 Re: DeepSeek R2 还没release... 是不是...🤔
发表于 : 2025年 5月 23日 07:55
由 TSG
zheliemit 写了: 2025年 5月 23日 04:59
deepseek R2的架构做了重大修改,不再用transformer架构了,这个transformaer架构是谷歌用来做翻译软件用的架构,不适合做逻辑推理。
新的LLM架构更牛逼,据说自己能设计数学概念,并自行推理,在测试环境下已经解决了不少物理难题。
粉酱又瞎JB口high了,deep seek里面的那两distillation能手早被Qwen给挖了LOL
#7 Re: DeepSeek R2 还没release... 是不是...🤔
发表于 : 2025年 5月 23日 11:48
由 张雅婷粉58Red2
一紙荒唐 写了: 2025年 5月 23日 03:02
舍不得把干货
白白的Open source 了...
等时机打脸
#8 Re: DeepSeek R2 还没release... 是不是...🤔
发表于 : 2025年 5月 23日 11:51
由 anesthetic
国内两周前就limited access了,人家学精灵了,好东西为啥要给霉蒂分享
#9 Re: DeepSeek R2 还没release... 是不是...🤔
发表于 : 2025年 5月 23日 11:58
由 shuiya
出了名气后,人多数就被挖走了,接下去要看Qwen。deepseek以后就半死不活的挂着吧。