厉害了我的国！刚刚DeepSeek又发布新模型！开源！

noparking · 帖子由 **noparking** » 昨天 08:52

@LiSheQiang DS的员工白牛随便操

freelikewind · 帖子由 **freelikewind** » 昨天 09:04

windy 写了：昨天 08:12
看了下，显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗？有。但是用处不大。类似的东西，包括多态模型，现在研究的多了。产品也多如牛毛。几个主打的大语言模型（其实这些都早不仅仅是“语言”模型了）都支持多模态输入。DS作为产品的卖点可以理解，从创新角度上真没啥好吹的

还没看这个新模型，不过tokenizer is vital。
tokenizer本身就是语言模型，永远不会低估它对语言处理的作用。

labi · 帖子由 **labi** » 昨天 09:12

股价毫无波澜，lol

jb · 帖子由 **jb（Joe Biden）** » 昨天 09:14

DeepSeek-OCR准确率97%还是太低。

xiaoju · 帖子由 **xiaoju（可爱的龙猫）** » 昨天 09:30

你又急的不懂装懂了。。。

openai的scaling law早就撞墙了，最近一年什么成果也没搞出来。人类的希望就看deepseek了

windy 写了：昨天 08:12
看了下，显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗？有。但是用处不大。类似的东西，包括多态模型，现在研究的多了。产品也多如牛毛。几个主打的大语言模型（其实这些都早不仅仅是“语言”模型了）都支持多模态输入。DS作为产品的卖点可以理解，从创新角度上真没啥好吹的

xiaoju · 帖子由 **xiaoju（可爱的龙猫）** » 昨天 09:31

这个东西的意义不在于OCR，而是提出了同时搞定GPT两个致命缺陷的办法

tokenizer
长context降智

jb 写了：昨天 09:14
DeepSeek-OCR准确率97%还是太低。

FGH · 帖子由 **FGH** » 昨天 09:38

DS以前一直被诟病缺乏多模态能力。这次算是补上了短板。是不是弯道超车了？再等等看。

windy · 帖子由 **windy（文帝）** » 昨天 10:30

插，说到不懂装懂，有谁比得上你这个在日本国的卢瑟啊。

现在各家确实都没啥大突破，但是DS在基本层面上已经落后了。编程现在是Claude,普通对话还是Chatgpt独领风骚。tokenizer本质上是prompt engineering的一部分，不光几大巨头在搞，很多不大不小的公司也在搞。DS搞的这种也就是雕虫小技。还敢吹成人类希望，也就你这种待在本子这种小国，没见过世面的才会说出这种疯话。

xiaoju 写了：昨天 09:30
你又急的不懂装懂了。。。

openai的scaling law早就撞墙了，最近一年什么成果也没搞出来。人类的希望就看deepseek了

DQQ · 帖子由 **DQQ** » 昨天 11:01

sgisp2 写了：昨天 07:51
应该是图像好记一些

sgisp2 · 帖子由 **sgisp2** » 昨天 16:49

DeepSeek是不是落后难讲，但是在创新维度上应该是远超美国那几个只能吃“菠菜”的大力水手滴！

就看R2是什么王炸啦

xiaoju · 帖子由 **xiaoju（可爱的龙猫）** » 昨天 18:06

尼玛，“tokenizer本质上是prompt engineering的一部分”

狗子急的脱粪了

windy 写了：昨天 10:30
插，说到不懂装懂，有谁比得上你这个在日本国的卢瑟啊。

现在各家确实都没啥大突破，但是DS在基本层面上已经落后了。编程现在是Claude,普通对话还是Chatgpt独领风骚。tokenizer本质上是prompt engineering的一部分，不光几大巨头在搞，很多不大不小的公司也在搞。DS搞的这种也就是雕虫小技。还敢吹成人类希望，也就你这种待在本子这种小国，没见过世面的才会说出这种疯话。

xiaoju · 帖子由 **xiaoju（可爱的龙猫）** » 昨天 18:07

你胡扯之前先上AI过一遍不行么？

FGH 写了：昨天 09:38
DS以前一直被诟病缺乏多模态能力。这次算是补上了短板。是不是弯道超车了？再等等看。

coltzhao · 帖子由 **coltzhao（bigdumbdumpling）** » 昨天 18:09

jb 写了：昨天 09:14
DeepSeek-OCR准确率97%还是太低。

人类就是大概98%

windy · 帖子由 **windy（文帝）** » 昨天 18:13

狗子屁都不懂，坐在井里觉得井好大

xiaoju 写了：昨天 18:06
尼玛，“tokenizer本质上是prompt engineering的一部分”

狗子急的脱粪了

4n4ly · 帖子由 **4n4ly** » 昨天 18:15

还真是有点反直觉，一张报纸的图片，按这个模型压缩后的大小比图片ocr转成文字的大小还小很多，理解的对不对？

xiaoju · 帖子由 **xiaoju（可爱的龙猫）** » 昨天 18:25

你个傻逼甚至不懂让AI给你纠正一下

windy 写了：昨天 18:13
狗子屁都不懂，坐在井里觉得井好大

xiaoju · 帖子由 **xiaoju（可爱的龙猫）** » 昨天 18:27

我举个例子说明一下：

现在的LLM的输入，是单词的词典编号
而deepseek-ocr的输入，是单词的图形

对于人类来说，记住图形更容易和省力，deepseek发现对于电脑也是一样

4n4ly 写了：昨天 18:15
还真是有点反直觉，一张报纸的图片，按这个模型压缩后的大小比图片ocr转成文字的大小还小很多，理解的对不对？

windy · 帖子由 **windy（文帝）** » 昨天 19:46

你要懂点信息论就不会觉得反直觉了。

4n4ly 写了：昨天 18:15
还真是有点反直觉，一张报纸的图片，按这个模型压缩后的大小比图片ocr转成文字的大小还小很多，理解的对不对？

windy · 帖子由 **windy（文帝）** » 昨天 19:55

其实从LLM来说，即使是几百个Billion的参数，和用来训练的数据里面包含的信息量相比，其实是非常小了。

tootsie · 帖子由 **tootsie** » 昨天 21:03

中文 vs 英文。 LOL

新未名空间

厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#21 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#22 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#23 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#24 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#25 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#26 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#27 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#28 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#29 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#30 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#31 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#32 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#33 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#34 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#35 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#36 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#37 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#38 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#39 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#40 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！