对应老买买提的军事天地,观点交锋比较激烈,反驳不留情面,请作好心理准备。因为此版帖子太多,所以新帖不出现在首页新帖列表,防止首页新帖刷屏太快。
版主: Softfist
-
noparking
- 知名作家

- 帖子互动: 18
- 帖子: 822
- 注册时间: 2022年 8月 12日 09:17
帖子
由 noparking »
-
freelikewind
- 知名作家

- 帖子互动: 83
- 帖子: 1017
- 注册时间: 2022年 7月 23日 15:32
帖子
由 freelikewind »
windy 写了: 今天 08:12
看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的
还没看这个新模型,不过tokenizer is vital。
tokenizer本身就是语言模型,永远不会低估它对语言处理的作用。
-
labi
- 论坛元老

- 帖子互动: 587
- 帖子: 18037
- 注册时间: 2022年 8月 3日 11:08
-
jb(Joe Biden)
- 论坛精英

- 帖子互动: 266
- 帖子: 5332
- 注册时间: 2024年 6月 23日 19:23
帖子
由 jb(Joe Biden) »
Joe Biden Says He Needs More Sleep and Less Work at Night.
夜晚多睡觉,少干活。
-
xiaoju(可爱的龙猫)
- 论坛元老

- 帖子互动: 1114
- 帖子: 26586
- 注册时间: 2023年 9月 5日 20:18
帖子
由 xiaoju(可爱的龙猫) »
你又急的不懂装懂了。。。
openai的scaling law早就撞墙了,最近一年什么成果也没搞出来。人类的希望就看deepseek了
windy 写了: 今天 08:12
看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的
-
xiaoju(可爱的龙猫)
- 论坛元老

- 帖子互动: 1114
- 帖子: 26586
- 注册时间: 2023年 9月 5日 20:18
帖子
由 xiaoju(可爱的龙猫) »
这个东西的意义不在于OCR,而是提出了同时搞定GPT两个致命缺陷的办法
- tokenizer
- 长context降智
jb 写了: 今天 09:14
DeepSeek-OCR准确率97%还是太低。
-
FGH
- 论坛精英

- 帖子互动: 107
- 帖子: 7080
- 注册时间: 2022年 7月 25日 16:30
帖子
由 FGH »
DS以前一直被诟病缺乏多模态能力。这次算是补上了短板。是不是弯道超车了?再等等看。
-
windy(文帝)
- 著名点评

- 帖子互动: 1022
- 帖子: 5202
- 注册时间: 2023年 2月 7日 18:53
帖子
由 windy(文帝) »
插,说到不懂装懂,有谁比得上你这个在日本国的卢瑟啊。
现在各家确实都没啥大突破,但是DS在基本层面上已经落后了。编程现在是Claude,普通对话还是Chatgpt独领风骚。tokenizer本质上是prompt engineering的一部分,不光几大巨头在搞,很多不大不小的公司也在搞。DS搞的这种也就是雕虫小技。还敢吹成人类希望,也就你这种待在本子这种小国,没见过世面的才会说出这种疯话。
xiaoju 写了: 今天 09:30
你又急的不懂装懂了。。。
openai的scaling law早就撞墙了,最近一年什么成果也没搞出来。人类的希望就看deepseek了
x1
-
DQQ
- 论坛精英

- 帖子互动: 156
- 帖子: 5335
- 注册时间: 2023年 1月 4日 16:17
-
sgisp2
- 著名点评

- 帖子互动: 136
- 帖子: 4823
- 注册时间: 2022年 7月 25日 01:12
帖子
由 sgisp2 »
DeepSeek是不是落后难讲,但是在创新维度上应该是远超美国那几个只能吃“菠菜”的大力水手滴!
就看R2是什么王炸啦
-
xiaoju(可爱的龙猫)
- 论坛元老

- 帖子互动: 1114
- 帖子: 26586
- 注册时间: 2023年 9月 5日 20:18
帖子
由 xiaoju(可爱的龙猫) »
尼玛,“tokenizer本质上是prompt engineering的一部分”
狗子急的脱粪了
windy 写了: 今天 10:30
插,说到不懂装懂,有谁比得上你这个在日本国的卢瑟啊。
现在各家确实都没啥大突破,但是DS在基本层面上已经落后了。编程现在是Claude,普通对话还是Chatgpt独领风骚。tokenizer本质上是prompt engineering的一部分,不光几大巨头在搞,很多不大不小的公司也在搞。DS搞的这种也就是雕虫小技。还敢吹成人类希望,也就你这种待在本子这种小国,没见过世面的才会说出这种疯话。
-
xiaoju(可爱的龙猫)
- 论坛元老

- 帖子互动: 1114
- 帖子: 26586
- 注册时间: 2023年 9月 5日 20:18
帖子
由 xiaoju(可爱的龙猫) »
你胡扯之前先上AI过一遍不行么?
FGH 写了: 今天 09:38
DS以前一直被诟病缺乏多模态能力。这次算是补上了短板。是不是弯道超车了?再等等看。
-
coltzhao(bigdumbdumpling)
- 论坛点评

- 帖子互动: 115
- 帖子: 2046
- 注册时间: 2022年 8月 1日 01:01
帖子
由 coltzhao(bigdumbdumpling) »
jb 写了: 今天 09:14
DeepSeek-OCR准确率97%还是太低。
人类就是大概98%
-
windy(文帝)
- 著名点评

- 帖子互动: 1022
- 帖子: 5202
- 注册时间: 2023年 2月 7日 18:53
帖子
由 windy(文帝) »
狗子屁都不懂,坐在井里觉得井好大
xiaoju 写了: 58 分钟前
尼玛,“tokenizer本质上是prompt engineering的一部分”
狗子急的脱粪了
-
4n4ly
- 著名写手

- 帖子互动: 22
- 帖子: 323
- 注册时间: 2025年 4月 15日 10:38
帖子
由 4n4ly »
还真是有点反直觉,一张报纸的图片,按这个模型压缩后的大小比图片ocr转成文字的大小还小很多, 理解的对不对?
-
xiaoju(可爱的龙猫)
- 论坛元老

- 帖子互动: 1114
- 帖子: 26586
- 注册时间: 2023年 9月 5日 20:18
帖子
由 xiaoju(可爱的龙猫) »
你个傻逼甚至不懂让AI给你纠正一下
windy 写了: 51 分钟前
狗子屁都不懂,坐在井里觉得井好大
-
xiaoju(可爱的龙猫)
- 论坛元老

- 帖子互动: 1114
- 帖子: 26586
- 注册时间: 2023年 9月 5日 20:18
帖子
由 xiaoju(可爱的龙猫) »
我举个例子说明一下:
现在的LLM的输入,是单词的词典编号
而deepseek-ocr的输入,是单词的图形
对于人类来说,记住图形更容易和省力,deepseek发现对于电脑也是一样
4n4ly 写了: 49 分钟前
还真是有点反直觉,一张报纸的图片,按这个模型压缩后的大小比图片ocr转成文字的大小还小很多, 理解的对不对?