厉害了我的国！刚刚DeepSeek又发布新模型！开源！

wanmeishijie

今天 03:07

2227 次阅读(2223 来自论坛) / 27 条评论

此博文来自论坛版块：军事天地（Military）

共 27 条评论

windy
5 分钟前

插，说到不懂装懂，有谁比得上你这个在日本国的卢瑟啊。

现在各家确实都没啥大突破，但是DS在基本层面上已经落后了。编程现在是Claude,普通对话还是Chatgpt独领风骚。tokenizer本质上是prompt engineering的一部分，不光几大巨头在搞，很多不大不小的公司也在搞。DS搞的这种也就是雕虫小技。还敢吹成人类希望，也就你这种待在本子这种小国，没见过世面的才会说出这种疯话。

xiaoju 写了：今天 09:30
你又急的不懂装懂了。。。

openai的scaling law早就撞墙了，最近一年什么成果也没搞出来。人类的希望就看deepseek了

评论
FGH
57 分钟前

DS以前一直被诟病缺乏多模态能力。这次算是补上了短板。是不是弯道超车了？再等等看。

评论
xiaoju
今天 09:31
这个东西的意义不在于OCR，而是提出了同时搞定GPT两个致命缺陷的办法
1. tokenizer
2. 长context降智
jb 写了：今天 09:14
DeepSeek-OCR准确率97%还是太低。

评论
xiaoju
今天 09:30

你又急的不懂装懂了。。。

openai的scaling law早就撞墙了，最近一年什么成果也没搞出来。人类的希望就看deepseek了

windy 写了：今天 08:12
看了下，显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗？有。但是用处不大。类似的东西，包括多态模型，现在研究的多了。产品也多如牛毛。几个主打的大语言模型（其实这些都早不仅仅是“语言”模型了）都支持多模态输入。DS作为产品的卖点可以理解，从创新角度上真没啥好吹的

评论
jb
今天 09:14

DeepSeek-OCR准确率97%还是太低。

评论
labi
今天 09:12

股价毫无波澜，lol

评论
freelikewind
今天 09:04

windy 写了：今天 08:12
看了下，显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗？有。但是用处不大。类似的东西，包括多态模型，现在研究的多了。产品也多如牛毛。几个主打的大语言模型（其实这些都早不仅仅是“语言”模型了）都支持多模态输入。DS作为产品的卖点可以理解，从创新角度上真没啥好吹的

还没看这个新模型，不过tokenizer is vital。
tokenizer本身就是语言模型，永远不会低估它对语言处理的作用。

评论
noparking
今天 08:52

@LiSheQiang DS的员工白牛随便操

评论
Bush
今天 08:20

sgisp2 写了：今天 04:33
兔子家缺算力，所以能搞出无穷的优质高效算法，又把老米甩得远远滴

评论
windy
今天 08:12

看了下，显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗？有。但是用处不大。类似的东西，包括多态模型，现在研究的多了。产品也多如牛毛。几个主打的大语言模型（其实这些都早不仅仅是“语言”模型了）都支持多模态输入。DS作为产品的卖点可以理解，从创新角度上真没啥好吹的

评论
Narcotics07
今天 08:04

Photographic memory, 不是雨人类自闭症有的嘛

这类人在米国被当特殊人（aka 傻子）

评论
Newsmax
今天 08:00

梁某人又要闯荡股市了？

评论
xiaoju
今天 07:59

我觉得本质上deekseek-ocr还是一个tokenizer

不过因为其基于现代LLM，而不是古典的BPE算法，所以可以更高效的降噪，只提取有用信息

sgisp2 写了：今天 07:51
应该是图像好记一些

评论
sgisp2
今天 07:51

应该是图像好记一些

评论
xiaoju
今天 06:24

deepseek-ocr的玩法是把重复信息忽略掉，比如100页稿纸，后面的只看内容不看格式，节省大量token

人也是这么阅读的

wanmeishijie 写了：今天 04:12
直观上文本必须tokenize再向量化。这个空间维度不低。
而图片如果是16色很有限

评论

查看全部评论

登录用户才可以发表评论!

wanmeishijie

厉害了我的国！刚刚DeepSeek又发布新模型！开源！

共 27 条评论

评论

wanmeishijie简介

博主最新文章