分页: 1 / 1

#1 DeepSeek R2 还没release... 是不是...🤔

发表于 : 2025年 5月 23日 03:02
一紙荒唐
舍不得把干货
白白的Open source 了...🤔

#2 Re: DeepSeek R2 还没release... 是不是...🤔

发表于 : 2025年 5月 23日 03:02
一紙荒唐
DeepSeek 也许就有了新的突破... 这几个月!
所以不大情愿白白的免费了

#3 Re: DeepSeek R2 还没release... 是不是...🤔

发表于 : 2025年 5月 23日 04:37
魔术强森
一紙荒唐 写了: 2025年 5月 23日 03:02 舍不得把干货
白白的Open source 了...🤔
第一个版本开源秀一下肌肉,后面没必要开源了。OpenAI不是也闭源。

#4 Re: DeepSeek R2 还没release... 是不是...🤔

发表于 : 2025年 5月 23日 04:59
zheliemit
deepseek R2的架构做了重大修改,不再用transformer架构了,这个transformaer架构是谷歌用来做翻译软件用的架构,不适合做逻辑推理。
新的LLM架构更牛逼,据说自己能设计数学概念,并自行推理,在测试环境下已经解决了不少物理难题。

#5 Re: DeepSeek R2 还没release... 是不是...🤔

发表于 : 2025年 5月 23日 07:21
一紙荒唐
zheliemit 写了: 2025年 5月 23日 04:59 deepseek R2的架构做了重大修改,不再用transformer架构了,这个transformaer架构是谷歌用来做翻译软件用的架构,不适合做逻辑推理。
新的LLM架构更牛逼,据说自己能设计数学概念,并自行推理,在测试环境下已经解决了不少物理难题。
Wow!

#6 Re: DeepSeek R2 还没release... 是不是...🤔

发表于 : 2025年 5月 23日 07:55
TSG
zheliemit 写了: 2025年 5月 23日 04:59 deepseek R2的架构做了重大修改,不再用transformer架构了,这个transformaer架构是谷歌用来做翻译软件用的架构,不适合做逻辑推理。
新的LLM架构更牛逼,据说自己能设计数学概念,并自行推理,在测试环境下已经解决了不少物理难题。

粉酱又瞎JB口high了,deep seek里面的那两distillation能手早被Qwen给挖了LOL

#7 Re: DeepSeek R2 还没release... 是不是...🤔

发表于 : 2025年 5月 23日 11:48
张雅婷粉58Red2
一紙荒唐 写了: 2025年 5月 23日 03:02 舍不得把干货
白白的Open source 了...🤔
等时机打脸

#8 Re: DeepSeek R2 还没release... 是不是...🤔

发表于 : 2025年 5月 23日 11:51
anesthetic
国内两周前就limited access了,人家学精灵了,好东西为啥要给霉蒂分享

#9 Re: DeepSeek R2 还没release... 是不是...🤔

发表于 : 2025年 5月 23日 11:58
shuiya
出了名气后,人多数就被挖走了,接下去要看Qwen。deepseek以后就半死不活的挂着吧。