厉害了我的国!刚刚DeepSeek又发布新模型!开源! wanmeishijie 今天 03:07 2227 次阅读(2223 来自论坛) / 27 条评论 此博文来自论坛版块:军事天地(Military) 共 27 条评论 windy 5 分钟前 插,说到不懂装懂,有谁比得上你这个在日本国的卢瑟啊。 现在各家确实都没啥大突破,但是DS在基本层面上已经落后了。编程现在是Claude,普通对话还是Chatgpt独领风骚。tokenizer本质上是prompt engineering的一部分,不光几大巨头在搞,很多不大不小的公司也在搞。DS搞的这种也就是雕虫小技。还敢吹成人类希望,也就你这种待在本子这种小国,没见过世面的才会说出这种疯话。 xiaoju 写了: 今天 09:30 你又急的不懂装懂了。。。 openai的scaling law早就撞墙了,最近一年什么成果也没搞出来。人类的希望就看deepseek了 评论 FGH 57 分钟前 DS以前一直被诟病缺乏多模态能力。这次算是补上了短板。是不是弯道超车了?再等等看。 评论 xiaoju 今天 09:31 这个东西的意义不在于OCR,而是提出了同时搞定GPT两个致命缺陷的办法 tokenizer 长context降智 jb 写了: 今天 09:14 DeepSeek-OCR准确率97%还是太低。 评论 xiaoju 今天 09:30 你又急的不懂装懂了。。。 openai的scaling law早就撞墙了,最近一年什么成果也没搞出来。人类的希望就看deepseek了 windy 写了: 今天 08:12 看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的 评论 jb 今天 09:14 DeepSeek-OCR准确率97%还是太低。 评论 labi 今天 09:12 股价毫无波澜,lol 评论 freelikewind 今天 09:04 windy 写了: 今天 08:12 看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的 还没看这个新模型,不过tokenizer is vital。 tokenizer本身就是语言模型,永远不会低估它对语言处理的作用。 评论 noparking 今天 08:52 @LiSheQiang DS的员工白牛随便操 评论 Bush 今天 08:20 sgisp2 写了: 今天 04:33 兔子家缺算力,所以能搞出无穷的优质高效算法,又把老米甩得远远滴 评论 windy 今天 08:12 看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的 评论 Narcotics07 今天 08:04 Photographic memory, 不是雨人类自闭症有的嘛 这类人在米国被当特殊人(aka 傻子) 评论 Newsmax 今天 08:00 梁某人又要闯荡股市了? 评论 xiaoju 今天 07:59 我觉得本质上deekseek-ocr还是一个tokenizer 不过因为其基于现代LLM,而不是古典的BPE算法,所以可以更高效的降噪,只提取有用信息 sgisp2 写了: 今天 07:51 应该是图像好记一些 评论 sgisp2 今天 07:51 应该是图像好记一些 评论 xiaoju 今天 06:24 deepseek-ocr的玩法是把重复信息忽略掉,比如100页稿纸,后面的只看内容不看格式,节省大量token 人也是这么阅读的 wanmeishijie 写了: 今天 04:12 直观上文本必须tokenize再向量化。这个空间维度不低。 而图片如果是16色很有限 评论 查看全部评论 评论 登录用户才可以发表评论!
插,说到不懂装懂,有谁比得上你这个在日本国的卢瑟啊。
现在各家确实都没啥大突破,但是DS在基本层面上已经落后了。编程现在是Claude,普通对话还是Chatgpt独领风骚。tokenizer本质上是prompt engineering的一部分,不光几大巨头在搞,很多不大不小的公司也在搞。DS搞的这种也就是雕虫小技。还敢吹成人类希望,也就你这种待在本子这种小国,没见过世面的才会说出这种疯话。
DS以前一直被诟病缺乏多模态能力。这次算是补上了短板。是不是弯道超车了?再等等看。
这个东西的意义不在于OCR,而是提出了同时搞定GPT两个致命缺陷的办法
你又急的不懂装懂了。。。
openai的scaling law早就撞墙了,最近一年什么成果也没搞出来。人类的希望就看deepseek了
DeepSeek-OCR准确率97%还是太低。
股价毫无波澜,lol
还没看这个新模型,不过tokenizer is vital。
tokenizer本身就是语言模型,永远不会低估它对语言处理的作用。
@LiSheQiang DS的员工白牛随便操
看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的
Photographic memory, 不是雨人类自闭症有的嘛
这类人在米国被当特殊人(aka 傻子)
梁某人又要闯荡股市了?
我觉得本质上deekseek-ocr还是一个tokenizer
不过因为其基于现代LLM,而不是古典的BPE算法,所以可以更高效的降噪,只提取有用信息
应该是图像好记一些
deepseek-ocr的玩法是把重复信息忽略掉,比如100页稿纸,后面的只看内容不看格式,节省大量token
人也是这么阅读的