Deepseek的事我一开始觉得振奋

对应老买买提的军事天地,观点交锋比较激烈。因为此版帖子太多,所以新帖不出现在首页新帖列表,防止首页新帖刷屏太快。

版主: Softfist

回复
头像
none楼主
论坛元老
论坛元老
2024年度十大优秀网友
帖子互动: 612
帖子: 21473
注册时间: 2022年 7月 22日 13:46

#1 Deepseek的事我一开始觉得振奋

帖子 none楼主 »

后来听说梁文峰是做量化投资的,
又看他的简历,本科毕业那年没能直接读研,
估计考了两次才读上研究生的。

我闻到一丝不确定。sorry
头像
none楼主
论坛元老
论坛元老
2024年度十大优秀网友
帖子互动: 612
帖子: 21473
注册时间: 2022年 7月 22日 13:46

#2 Re: Deepseek的事我一开始觉得振奋

帖子 none楼主 »

真正沉下心做研究的人,
不是这种人。
fox
论坛元老
论坛元老
帖子互动: 1041
帖子: 20480
注册时间: 2022年 11月 30日 14:35

#3 Re: Deepseek的事我一开始觉得振奋

帖子 fox »

阿里达摩院出品,你懂的






图片



中国AI新创公司DeepSeek近来迅速走红,令硅谷十分紧张。DeepSeek-V2的关键开发者之一是被称为95后AI「天才少女」罗福莉。小米创始人雷军以人民币千万元年薪招揽罗福莉,领导小米AI大模型团队。

红星资本局报导,2024年底,DeepSeek发布了新一代大语言模型DeepSeek-V3,同时宣布开源。1月20日,DeepSeek发布新模型DeepSeek-R1并同步开源模型权重,再次引发全球AI科技圈关注。

DeepSeek昨天(26日)曾出现短时闪崩现象,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后用户访问量激增,服务器一时无法满足大量用户的并发需求。

红星资本局指,在多项基准测试中,V3的成绩超越了主流开源模型,并和世界顶尖的闭源模型不分伯仲。同时,由于其极低的训练成本,DeepSeek-V3被称为「AI界拼多多」。

公开数据显示,DeepSeek来自杭州「深度求索人工智能基础技术研究有限公司」(下称「深度求索公司」),专注于开发先进的大语言模型和相关技术,由中国知名量化资管巨头「幻方量化」于2023年7月创立,也因此获得资本市场的广泛关注。

而DeepSeek-V2的关键开发者之一罗福莉也迅速走红,她被称为95后(1995年以后出生)AI「天才少女」。罗福莉本科就读于北京师范大学电脑专业,硕士毕业于北京大学计算语言学专业。

硕士毕业后,罗福莉先是进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。

2022年,罗福莉加入「幻方量化」从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。

就在DeepSeek-V3发布前几天,小米创始人雷军已开出千万年薪招聘罗福莉,领导小米AI大模型团队。

DeepSeek的爆火后,登顶苹果中国和美国应用商店免费APP下载排行榜,超越了ChatGPT。

澎湃新闻报导,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第3,与OpenAI的ChatGPT-4o最新版并列。不过,DeepSeek-R1的预训练费用为557.6万美元,不到OpenAI GPT-4o模型训练成本的十分之一。

红星资本局称,DeepSeek公司的北京子公司正在招人,现共释出52个岗位,包括深度学习研究员、内核系统研发工程师以及资深ui设计师等。其中,薪资最高的为内核系统研发工程师(校招),薪资范围人民币6至9万元;大部分岗位的起薪在人民币2万元及以上。

DeepSeek以其研发的极低成本优势,引起美国硅谷等AI公司的紧张。澎湃新闻27日引述Information网站报导,脸书母公司Meta已成立了4个专门研究小组来研究量化巨头「幻方量化」旗下的国产大模型DeepSeek的工作原理,并基于此来改进旗下大模型Llama。

其中2个小组正在试图了解「幻方量化」如何降低训练和运行DeepSeek的成本;第3个研究小组则正在研究「幻方量化」可能使用了哪些数据来训练其模型;第4个小组正在考虑基于DeepSeek模型属性重构Meta模型的新技术。

据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达(辉达)H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成,仅是OpenAI GPT-4o模型训练成本的不到十分之一。一经推出,DeepSeek-R1便凭借其物美价廉的特性在海外开发者社区中引发了轰动,更是凭借极低的训练成本震撼了硅谷。

数日前,有Meta的工程师们在匿名社交平台TeamBlind上吐露心声,表示DeepSeek所研发的AI模型为其带来了巨大压力。
上次由 fox 在 2025年 1月 28日 11:11 修改。
头像
none楼主
论坛元老
论坛元老
2024年度十大优秀网友
帖子互动: 612
帖子: 21473
注册时间: 2022年 7月 22日 13:46

#4 Re: Deepseek的事我一开始觉得振奋

帖子 none楼主 »

他在以前做量化投资时的风骚照片,
和现在参加总理座谈会的书呆子技术大拿形象,
有很大差异。
idea911(let_rr)
著名点评
著名点评
帖子互动: 164
帖子: 3600
注册时间: 2022年 10月 23日 13:47

#5 Re: Deepseek的事我一开始觉得振奋

帖子 idea911(let_rr) »

none 写了: 2025年 1月 28日 11:08 后来听说梁文峰是做量化投资的,
又看他的简历,本科毕业那年没能直接读研,
估计考了两次才读上研究生的。

我闻到一丝不确定。sorry
大学成绩跟科研成果和后续成绩完全不成正比,只有美华在意
x3 图片
头像
none楼主
论坛元老
论坛元老
2024年度十大优秀网友
帖子互动: 612
帖子: 21473
注册时间: 2022年 7月 22日 13:46

#6 Re: Deepseek的事我一开始觉得振奋

帖子 none楼主 »

为什么偏偏是杭州系???
malta(island)
论坛元老
论坛元老
帖子互动: 2185
帖子: 33070
注册时间: 2022年 12月 2日 18:19

#7 Re: Deepseek的事我一开始觉得振奋

帖子 malta(island) »

你总算说句人话。肯定上老套路,剽窃抄袭换壳然后吹牛逼
feng3
论坛点评
论坛点评
帖子互动: 206
帖子: 2869
注册时间: 2024年 1月 3日 16:05

#8 Re: Deepseek的事我一开始觉得振奋

帖子 feng3 »

就是借炒作收割一波,在股市;这点很成功
idea911(let_rr)
著名点评
著名点评
帖子互动: 164
帖子: 3600
注册时间: 2022年 10月 23日 13:47

#9 Re: Deepseek的事我一开始觉得振奋

帖子 idea911(let_rr) »

none 写了: 2025年 1月 28日 11:09 真正沉下心做研究的人,
不是这种人。
胡扯蛋,你所谓沉下心做研究都是像雷军一样微创新式人物
头像
none楼主
论坛元老
论坛元老
2024年度十大优秀网友
帖子互动: 612
帖子: 21473
注册时间: 2022年 7月 22日 13:46

#10 Re: Deepseek的事我一开始觉得振奋

帖子 none楼主 »

没有人能随随便便成功,
背后资本的力量,
谁放在那个位置上,谁身不由己,谁成为会飞的猪。
头像
none楼主
论坛元老
论坛元老
2024年度十大优秀网友
帖子互动: 612
帖子: 21473
注册时间: 2022年 7月 22日 13:46

#11 Re: Deepseek的事我一开始觉得振奋

帖子 none楼主 »

我只是谨慎表达了我的直觉。
你们随意。
Caravel
论坛元老
论坛元老
Caravel 的博客
帖子互动: 517
帖子: 23734
注册时间: 2022年 7月 24日 17:21

#12 Re: Deepseek的事我一开始觉得振奋

帖子 Caravel »

none 写了: 2025年 1月 28日 11:09 真正沉下心做研究的人,
不是这种人。
他是商人,你看看他手下简历就知道了
wanmeishijie(石昊)
论坛元老
论坛元老
wanmeishijie 的博客
帖子互动: 1972
帖子: 67067
注册时间: 2022年 12月 10日 23:58

#14 Re: Deepseek的事我一开始觉得振奋

帖子 wanmeishijie(石昊) »

囊教授质疑南蛮子,是一个好的开始。当然南蛮子也不全是骗子,我认为既然是开源那么是可以验证的
理解了老将是代入狗的视角之后,你就理解了老将
viewtopic.php?t=120513

理解了它们是代入狗的视角之后,它们为什么会嘲笑不愿意当狗的人,以及为什么会害怕想要反抗的人,就都可以理解了:
“放着好好的狗不当” :lol:
waterflow(流水行)
论坛精英
论坛精英
帖子互动: 345
帖子: 5539
注册时间: 2023年 3月 4日 19:27

#15 Re: Deepseek的事我一开始觉得振奋

帖子 waterflow(流水行) »

他不是直接算法程序员,他是老板,考了两次研究生的,往往更能作老板。读书的一个副作用,就是把人搞胆小、搞太规范,也就没有活力了。
x1 图片
上次由 waterflow 在 2025年 1月 28日 11:30 修改。
头像
none楼主
论坛元老
论坛元老
2024年度十大优秀网友
帖子互动: 612
帖子: 21473
注册时间: 2022年 7月 22日 13:46

#16 Re: Deepseek的事我一开始觉得振奋

帖子 none楼主 »

那又何必在各种媒体上扮演技术大拿?
我特别恶心这种虚假。
waterflow 写了: 2025年 1月 28日 11:28 他不是直接算法程序员,他是老板,考了两次研究生的,往往更能作老板。
idea911(let_rr)
著名点评
著名点评
帖子互动: 164
帖子: 3600
注册时间: 2022年 10月 23日 13:47

#17 Re: Deepseek的事我一开始觉得振奋

帖子 idea911(let_rr) »

none 写了: 2025年 1月 28日 11:29 那又何必在各种媒体上扮演技术大拿?
我特别恶心这种虚假。
人家的量化技术赚了几十亿,你的狗屁技术赚了多少钱?
头像
none楼主
论坛元老
论坛元老
2024年度十大优秀网友
帖子互动: 612
帖子: 21473
注册时间: 2022年 7月 22日 13:46

#18 Re: Deepseek的事我一开始觉得振奋

帖子 none楼主 »

希望是真的吧。国内年轻人的科研能力,有这么强?
如果这么强,在攻读博士的时候为什么没显山露水?
他们的博士导师都是喝稀饭的? :lol:
Caravel 写了: 2025年 1月 28日 11:18 他是商人,你看看他手下简历就知道了
sgisp2
著名点评
著名点评
帖子互动: 103
帖子: 3955
注册时间: 2022年 7月 25日 01:12

#19 Re: Deepseek的事我一开始觉得振奋

帖子 sgisp2 »

都开源了,可以自行判断
wanmeishijie(石昊)
论坛元老
论坛元老
wanmeishijie 的博客
帖子互动: 1972
帖子: 67067
注册时间: 2022年 12月 10日 23:58

#20 Re: Deepseek的事我一开始觉得振奋

帖子 wanmeishijie(石昊) »

none 写了: 2025年 1月 28日 11:29 那又何必在各种媒体上扮演技术大拿?
我特别恶心这种虚假。
搞量化的,不代表智力差。事实上这个行业长期吸引物理和计算机专业的高智商人才
理解了老将是代入狗的视角之后,你就理解了老将
viewtopic.php?t=120513

理解了它们是代入狗的视角之后,它们为什么会嘲笑不愿意当狗的人,以及为什么会害怕想要反抗的人,就都可以理解了:
“放着好好的狗不当” :lol:
alps5241
论坛精英
论坛精英
帖子互动: 418
帖子: 5764
注册时间: 2023年 12月 11日 23:45

#21 Re: Deepseek的事我一开始觉得振奋

帖子 alps5241 »

waterflow 写了: 2025年 1月 28日 11:28 他不是直接算法程序员,他是老板,考了两次研究生的,往往更能作老板。
读书的一个副作用,就是把人搞胆小、搞太规范,也就没有活力了。
re
回复

回到 “军事天地(Military)”