分页: 2 / 3

#21 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 08:52
noparking

@LiSheQiang DS的员工白牛随便操


#22 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 09:04
freelikewind
windy 写了: 昨天 08:12

看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的

还没看这个新模型,不过tokenizer is vital。
tokenizer本身就是语言模型,永远不会低估它对语言处理的作用。


#23 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 09:12
labi

股价毫无波澜,lol


#24 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 09:14
jb

DeepSeek-OCR准确率97%还是太低。


#25 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 09:30
xiaoju

你又急的不懂装懂了。。。

openai的scaling law早就撞墙了,最近一年什么成果也没搞出来。人类的希望就看deepseek了

windy 写了: 昨天 08:12

看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的


#26 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 09:31
xiaoju

这个东西的意义不在于OCR,而是提出了同时搞定GPT两个致命缺陷的办法

  1. tokenizer
  2. 长context降智
jb 写了: 昨天 09:14

DeepSeek-OCR准确率97%还是太低。


#27 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 09:38
FGH

DS以前一直被诟病缺乏多模态能力。这次算是补上了短板。是不是弯道超车了?再等等看。


#28 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 10:30
windy

插,说到不懂装懂,有谁比得上你这个在日本国的卢瑟啊。

现在各家确实都没啥大突破,但是DS在基本层面上已经落后了。编程现在是Claude,普通对话还是Chatgpt独领风骚。tokenizer本质上是prompt engineering的一部分,不光几大巨头在搞,很多不大不小的公司也在搞。DS搞的这种也就是雕虫小技。还敢吹成人类希望,也就你这种待在本子这种小国,没见过世面的才会说出这种疯话。

xiaoju 写了: 昨天 09:30

你又急的不懂装懂了。。。

openai的scaling law早就撞墙了,最近一年什么成果也没搞出来。人类的希望就看deepseek了


#29 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 11:01
DQQ
sgisp2 写了: 昨天 07:51

应该是图像好记一些

图片


#30 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 16:49
sgisp2

DeepSeek是不是落后难讲,但是在创新维度上应该是远超美国那几个只能吃“菠菜”的大力水手滴!

就看R2是什么王炸啦


#31 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 18:06
xiaoju

尼玛,“tokenizer本质上是prompt engineering的一部分”

狗子急的脱粪了

windy 写了: 昨天 10:30

插,说到不懂装懂,有谁比得上你这个在日本国的卢瑟啊。

现在各家确实都没啥大突破,但是DS在基本层面上已经落后了。编程现在是Claude,普通对话还是Chatgpt独领风骚。tokenizer本质上是prompt engineering的一部分,不光几大巨头在搞,很多不大不小的公司也在搞。DS搞的这种也就是雕虫小技。还敢吹成人类希望,也就你这种待在本子这种小国,没见过世面的才会说出这种疯话。


#32 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 18:07
xiaoju

你胡扯之前先上AI过一遍不行么?

FGH 写了: 昨天 09:38

DS以前一直被诟病缺乏多模态能力。这次算是补上了短板。是不是弯道超车了?再等等看。


#33 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 18:09
coltzhao
jb 写了: 昨天 09:14

DeepSeek-OCR准确率97%还是太低。

人类就是大概98%


#34 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 18:13
windy

狗子屁都不懂,坐在井里觉得井好大

xiaoju 写了: 昨天 18:06

尼玛,“tokenizer本质上是prompt engineering的一部分”

狗子急的脱粪了


#35 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 18:15
4n4ly

还真是有点反直觉,一张报纸的图片,按这个模型压缩后的大小比图片ocr转成文字的大小还小很多, 理解的对不对?


#36 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 18:25
xiaoju

你个傻逼甚至不懂让AI给你纠正一下

windy 写了: 昨天 18:13

狗子屁都不懂,坐在井里觉得井好大


#37 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 18:27
xiaoju

我举个例子说明一下:

现在的LLM的输入,是单词的词典编号
而deepseek-ocr的输入,是单词的图形

对于人类来说,记住图形更容易和省力,deepseek发现对于电脑也是一样

4n4ly 写了: 昨天 18:15

还真是有点反直觉,一张报纸的图片,按这个模型压缩后的大小比图片ocr转成文字的大小还小很多, 理解的对不对?


#38 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 19:46
windy

你要懂点信息论就不会觉得反直觉了。

4n4ly 写了: 昨天 18:15

还真是有点反直觉,一张报纸的图片,按这个模型压缩后的大小比图片ocr转成文字的大小还小很多, 理解的对不对?


#39 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 19:55
windy

其实从LLM来说,即使是几百个Billion的参数,和用来训练的数据里面包含的信息量相比,其实是非常小了。


#40 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 21:03
tootsie

中文 vs 英文。 LOL