厉害了我的国！刚刚DeepSeek又发布新模型！开源！

fanqie · 帖子由 **fanqie** » 今天 03:35

放话这里，比R1的影响力还大

xiaozhao · 帖子由 **xiaozhao** » 今天 03:41

确实牛b，这个模型的论文，揭露一个结论，文本可能不是llm的最好输入，图片和视频才是。而图片和视频可以压缩很小，所以给一个图片的txt，运算量小很多。

foofy · 帖子由 **foofy（自带干粮五毛）** » 今天 03:58

xiaoju · 帖子由 **xiaoju（可爱的龙猫）** » 今天 04:11

叔去年就这么说

但是你弟业界折腾一年，除了烧器材的砸钱的，一个实质性成就也没有

xiaozhao 写了：今天 03:41
确实牛b，这个模型的论文，揭露一个结论，文本可能不是llm的最好输入，图片和视频才是。而图片和视频可以压缩很小，所以给一个图片的txt，运算量小很多。

wanmeishijie

xiaozhao 写了：今天 03:41
确实牛b，这个模型的论文，揭露一个结论，文本可能不是llm的最好输入，图片和视频才是。而图片和视频可以压缩很小，所以给一个图片的txt，运算量小很多。

直观上文本必须tokenize再向量化。这个空间维度不低。
而图片如果是16色很有限

sgisp2 · 帖子由 **sgisp2** » 今天 04:33

兔子家缺算力，所以能搞出无穷的优质高效算法，又把老米甩得远远滴

redot · 帖子由 **redot（红薯林）** » 今天 04:46

注意力权重，是人的本能之一
如对号码的记忆，是恨明显的例子

老蛆 · 帖子由老蛆 » 今天 04:50

文本为什么需要16色？lgbt专用文本？

wanmeishijie 写了：今天 04:12
直观上文本必须tokenize再向量化。这个空间维度不低。
而图片如果是16色很有限

coltzhao · 帖子由 **coltzhao（bigdumbdumpling）** » 今天 05:05

这个按发表的数字是很牛的，而且很新，以前没人走过的路。

zheliemit · 帖子由 **zheliemit（繁体中文）** » 今天 05:20

现在开源大模型都被你憋包揽了前三名：智谱、QWen、Deepseek

民主自由是婊子的遮羞布

sgisp2 写了：今天 04:33
兔子家缺算力，所以能搞出无穷的优质高效算法，又把老米甩得远远滴

麻痹的，兔子太猛

就像兔子家的发动机不行

就在气动外形和模型上下功夫

最后搞出极致的气动模型

xiaoju · 帖子由 **xiaoju（可爱的龙猫）** » 今天 06:22

缺算力是个伪命题，你只要有钱token要多少有多少

你弟的本质问题是明明没钱，却装成大款无限烧钱，所以研发停滞不前

sgisp2 写了：今天 04:33
兔子家缺算力，所以能搞出无穷的优质高效算法，又把老米甩得远远滴

xiaoju · 帖子由 **xiaoju（可爱的龙猫）** » 今天 06:24

deepseek-ocr的玩法是把重复信息忽略掉，比如100页稿纸，后面的只看内容不看格式，节省大量token

人也是这么阅读的

wanmeishijie 写了：今天 04:12
直观上文本必须tokenize再向量化。这个空间维度不低。
而图片如果是16色很有限

sgisp2 · 帖子由 **sgisp2** » 今天 07:51

应该是图像好记一些

xiaoju · 帖子由 **xiaoju（可爱的龙猫）** » 今天 07:59

我觉得本质上deekseek-ocr还是一个tokenizer

不过因为其基于现代LLM，而不是古典的BPE算法，所以可以更高效的降噪，只提取有用信息

sgisp2 写了：今天 07:51
应该是图像好记一些

Newsmax · 帖子由 **Newsmax** » 今天 08:00

梁某人又要闯荡股市了？

Narcotics07 · 帖子由 **Narcotics07** » 今天 08:04

Photographic memory, 不是雨人类自闭症有的嘛

这类人在米国被当特殊人（aka 傻子）

windy · 帖子由 **windy（文帝）** » 今天 08:12

看了下，显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗？有。但是用处不大。类似的东西，包括多态模型，现在研究的多了。产品也多如牛毛。几个主打的大语言模型（其实这些都早不仅仅是“语言”模型了）都支持多模态输入。DS作为产品的卖点可以理解，从创新角度上真没啥好吹的

Bush · 帖子由 **Bush（不是）** » 今天 08:20

sgisp2 写了：今天 04:33
兔子家缺算力，所以能搞出无穷的优质高效算法，又把老米甩得远远滴

新未名空间

厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#1 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#2 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#3 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#4 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#5 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#6 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#7 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#8 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#9 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#10 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#11 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#12 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#13 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#14 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#15 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#16 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#17 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#18 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#19 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！

#20 Re: 厉害了我的国！刚刚DeepSeek又发布新模型！开源！