厉害了我的国!刚刚DeepSeek又发布新模型!开源!

wanmeishijie

此博文来自论坛版块:军事天地(Military)

共 27 条评论

  1. windy
    windy

    插,说到不懂装懂,有谁比得上你这个在日本国的卢瑟啊。

    现在各家确实都没啥大突破,但是DS在基本层面上已经落后了。编程现在是Claude,普通对话还是Chatgpt独领风骚。tokenizer本质上是prompt engineering的一部分,不光几大巨头在搞,很多不大不小的公司也在搞。DS搞的这种也就是雕虫小技。还敢吹成人类希望,也就你这种待在本子这种小国,没见过世面的才会说出这种疯话。

    xiaoju 写了: 今天 09:30

    你又急的不懂装懂了。。。

    openai的scaling law早就撞墙了,最近一年什么成果也没搞出来。人类的希望就看deepseek了

  2. FGH
    FGH

    DS以前一直被诟病缺乏多模态能力。这次算是补上了短板。是不是弯道超车了?再等等看。

  3. xiaoju
    xiaoju

    这个东西的意义不在于OCR,而是提出了同时搞定GPT两个致命缺陷的办法

    1. tokenizer
    2. 长context降智
    jb 写了: 今天 09:14

    DeepSeek-OCR准确率97%还是太低。

  4. xiaoju
    xiaoju

    你又急的不懂装懂了。。。

    openai的scaling law早就撞墙了,最近一年什么成果也没搞出来。人类的希望就看deepseek了

    windy 写了: 今天 08:12

    看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的

  5. jb
    jb

    DeepSeek-OCR准确率97%还是太低。

  6. labi
    labi

    股价毫无波澜,lol

  7. freelikewind
    freelikewind

    windy 写了: 今天 08:12

    看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的

    还没看这个新模型,不过tokenizer is vital。
    tokenizer本身就是语言模型,永远不会低估它对语言处理的作用。

  8. noparking
    noparking

    @LiSheQiang DS的员工白牛随便操

  9. Bush
    Bush

    sgisp2 写了: 今天 04:33

    兔子家缺算力,所以能搞出无穷的优质高效算法,又把老米甩得远远滴

  10. windy
    windy

    看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的

  11. Narcotics07
    Narcotics07

    Photographic memory, 不是雨人类自闭症有的嘛

    这类人在米国被当特殊人(aka 傻子)

  12. Newsmax
    Newsmax

    梁某人又要闯荡股市了?

  13. xiaoju
    xiaoju

    我觉得本质上deekseek-ocr还是一个tokenizer

    不过因为其基于现代LLM,而不是古典的BPE算法,所以可以更高效的降噪,只提取有用信息

    sgisp2 写了: 今天 07:51

    应该是图像好记一些

  14. sgisp2
    sgisp2

    应该是图像好记一些

  15. xiaoju
    xiaoju

    deepseek-ocr的玩法是把重复信息忽略掉,比如100页稿纸,后面的只看内容不看格式,节省大量token

    人也是这么阅读的

    wanmeishijie 写了: 今天 04:12

    直观上文本必须tokenize再向量化。这个空间维度不低。
    而图片如果是16色很有限

  16. 查看全部评论

评论

© 2024newmitbbs.com

Theme by Anders NorenUp ↑