分页: 2 / 3
#21 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 08:52
由 noparking
#22 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 09:04
由 freelikewind
windy 写了: 昨天 08:12
看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的
还没看这个新模型,不过tokenizer is vital。
tokenizer本身就是语言模型,永远不会低估它对语言处理的作用。
#23 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 09:12
由 labi
#24 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 09:14
由 jb
#25 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 09:30
由 xiaoju
你又急的不懂装懂了。。。
openai的scaling law早就撞墙了,最近一年什么成果也没搞出来。人类的希望就看deepseek了
windy 写了: 昨天 08:12
看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的
#26 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 09:31
由 xiaoju
这个东西的意义不在于OCR,而是提出了同时搞定GPT两个致命缺陷的办法
- tokenizer
- 长context降智
jb 写了: 昨天 09:14
DeepSeek-OCR准确率97%还是太低。
#27 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 09:38
由 FGH
DS以前一直被诟病缺乏多模态能力。这次算是补上了短板。是不是弯道超车了?再等等看。
#28 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 10:30
由 windy
插,说到不懂装懂,有谁比得上你这个在日本国的卢瑟啊。
现在各家确实都没啥大突破,但是DS在基本层面上已经落后了。编程现在是Claude,普通对话还是Chatgpt独领风骚。tokenizer本质上是prompt engineering的一部分,不光几大巨头在搞,很多不大不小的公司也在搞。DS搞的这种也就是雕虫小技。还敢吹成人类希望,也就你这种待在本子这种小国,没见过世面的才会说出这种疯话。
xiaoju 写了: 昨天 09:30
你又急的不懂装懂了。。。
openai的scaling law早就撞墙了,最近一年什么成果也没搞出来。人类的希望就看deepseek了
#29 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 11:01
由 DQQ
#30 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 16:49
由 sgisp2
DeepSeek是不是落后难讲,但是在创新维度上应该是远超美国那几个只能吃“菠菜”的大力水手滴!
就看R2是什么王炸啦
#31 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 18:06
由 xiaoju
尼玛,“tokenizer本质上是prompt engineering的一部分”
狗子急的脱粪了
windy 写了: 昨天 10:30
插,说到不懂装懂,有谁比得上你这个在日本国的卢瑟啊。
现在各家确实都没啥大突破,但是DS在基本层面上已经落后了。编程现在是Claude,普通对话还是Chatgpt独领风骚。tokenizer本质上是prompt engineering的一部分,不光几大巨头在搞,很多不大不小的公司也在搞。DS搞的这种也就是雕虫小技。还敢吹成人类希望,也就你这种待在本子这种小国,没见过世面的才会说出这种疯话。
#32 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 18:07
由 xiaoju
你胡扯之前先上AI过一遍不行么?
FGH 写了: 昨天 09:38
DS以前一直被诟病缺乏多模态能力。这次算是补上了短板。是不是弯道超车了?再等等看。
#33 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 18:09
由 coltzhao
jb 写了: 昨天 09:14
DeepSeek-OCR准确率97%还是太低。
人类就是大概98%
#34 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 18:13
由 windy
狗子屁都不懂,坐在井里觉得井好大
xiaoju 写了: 昨天 18:06
尼玛,“tokenizer本质上是prompt engineering的一部分”
狗子急的脱粪了
#35 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 18:15
由 4n4ly
还真是有点反直觉,一张报纸的图片,按这个模型压缩后的大小比图片ocr转成文字的大小还小很多, 理解的对不对?
#36 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 18:25
由 xiaoju
你个傻逼甚至不懂让AI给你纠正一下
windy 写了: 昨天 18:13
狗子屁都不懂,坐在井里觉得井好大
#37 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 18:27
由 xiaoju
我举个例子说明一下:
现在的LLM的输入,是单词的词典编号
而deepseek-ocr的输入,是单词的图形
对于人类来说,记住图形更容易和省力,deepseek发现对于电脑也是一样
4n4ly 写了: 昨天 18:15
还真是有点反直觉,一张报纸的图片,按这个模型压缩后的大小比图片ocr转成文字的大小还小很多, 理解的对不对?
#38 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 19:46
由 windy
你要懂点信息论就不会觉得反直觉了。
4n4ly 写了: 昨天 18:15
还真是有点反直觉,一张报纸的图片,按这个模型压缩后的大小比图片ocr转成文字的大小还小很多, 理解的对不对?
#39 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 19:55
由 windy
其实从LLM来说,即使是几百个Billion的参数,和用来训练的数据里面包含的信息量相比,其实是非常小了。
#40 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 21:03
由 tootsie