分页: 2 / 2

#21 Re: Deepseek在我看来的重大意义

发表于 : 2025年 1月 29日 21:17
YL7983
DeepSeek 跟你比较,你觉得谁更厉害?
ChatGPT said:

ChatGPT
如果从整体能力来看,ChatGPT 和 DeepSeek 各有优势,具体表现取决于任务的类型和评估标准。

1. 语言理解与生成
ChatGPT:在通用语言理解、创意写作、逻辑推理和代码解释等方面表现较强,训练数据更丰富,能较好地保持上下文一致性。
DeepSeek:在处理中文内容方面更具本土化优势,尤其是在阅读理解和文本生成上可能更符合中文用户的使用习惯。
2. 数学与科学推理
ChatGPT:在数学证明、定理推导、数学奥林匹克题目以及高等数学领域表现优异。适用于解决复杂的数学推理问题。
DeepSeek:据一些测试反馈,它在数学计算和公式推导上也有不错的表现,尤其在数值计算任务上可能更精准,但在数学推理方面未必胜出。
3. 代码与编程
ChatGPT:支持多种编程语言,能够提供代码示例、调试建议、优化思路,并结合数学背景给出更高质量的算法解释。
DeepSeek:特别是 DeepSeek Coder(专门的代码模型)在某些特定任务上的代码补全和生成能力较强,尤其是对于 Python、C++ 等语言的短代码片段。
4. 实时信息获取
ChatGPT(带 Web 访问能力)能够搜索最新信息,适用于需要实时数据的任务,例如新闻、学术进展等。
DeepSeek:目前大部分测试显示它的知识库可能更偏向于训练时的数据,不一定能获取最新信息。
5. 中文理解与翻译
ChatGPT:虽然中文能力已经很强,但有时候会稍微倾向英式表达,翻译可能更偏“信达雅”。
DeepSeek:中文训练数据更本土化,在某些场景下可能会更自然,但在复杂语言任务上未必全面胜出。
6. 逻辑推理与世界知识
ChatGPT:在复杂逻辑推理、哲学问题、跨学科知识整合等方面更占优势,适用于学术讨论和深度分析。
DeepSeek:在部分任务上表现不错,但在复杂推理问题上可能会更容易出现漏洞。
综合评价
如果你的任务偏向数学推理、代码解释、学术讨论、哲学推理或需要实时信息,那么 ChatGPT 可能更合适。如果你更关注本土化的中文写作、简单的数学计算、短代码补全,DeepSeek 可能更有优势。

你有具体的使用场景想要对比测试吗?

#22 Re: Deepseek在我看来的重大意义

发表于 : 2025年 1月 29日 21:21
YL7983
DeepSeek怎么回答这个问题?

#23 Re: Deepseek在我看来的重大意义

发表于 : 2025年 1月 29日 21:31
(ヅ)
YL7983 写了: 2025年 1月 29日 21:21 DeepSeek怎么回答这个问题?
>>> ChatGPT 跟你比较,你觉得谁更厉害?
<think>
我是由深度求索公司独立开发的DeepSeek-R1。关于不同模型的差异,建议您参考官方信息或亲自体验。我会继续专注于以诚实专业
的态度为您提供最好的帮助。
</think>

我是由深度求索公司独立开发的DeepSeek-R1。关于不同模型的差异,建议您参考官方信息或亲自体验。我会继续专注于以诚实专业
的态度为您提供最好的帮助。

#24 Re: Deepseek在我看来的重大意义

发表于 : 2025年 1月 30日 04:45
redot
TheMatrix 写了: 2025年 1月 29日 12:47 但是智能inference,不能训练吧?那样的话本质上和在网站上用没什么区别。
本地训练,微调,个性化是可以的, 你去看一看 readme文件

#25 Re: Deepseek在我看来的重大意义

发表于 : 2025年 1月 30日 07:18
idea911
netflix 写了: 2025年 1月 29日 15:17 大多数人根本无所谓数据上传的问题,网络app版也是免费的
公司在乎,我们公司就不让用chatgpt
如果公司能自己部署一个deepseek,肯定是愿意的

#26 Re: Deepseek在我看来的重大意义

发表于 : 2025年 1月 30日 11:07
fanqie
idea911 写了: 2025年 1月 30日 07:18 公司在乎,我们公司就不让用chatgpt
如果公司能自己不是一个deepseek,肯定是愿意的
如何用本地数据微调将是学问了.

#27 Re: Deepseek在我看来的重大意义

发表于 : 2025年 1月 30日 16:09
TheMatrix
redot 写了: 2025年 1月 30日 04:45 本地训练,微调,个性化是可以的, 你去看一看 readme文件
图片

#28 Re: Deepseek在我看来的重大意义

发表于 : 2025年 1月 30日 16:14
jiml
(ヅ) 写了: 2025年 1月 29日 12:07 大家都可以edge compute了,不用再依赖大厂

轻松部署一个性能不差的小模型也可以一战

新电脑手机自带的NPU派上了用处

对女大应该是负面消息,对高通果果按摩店英特尔做消费端比较正面

玩玩可以,商业不可行

一包冻饺子4块钱,你自己手工做,成本加时间20块

手工作坊小批量,无法同工业化量产相比

#29 Re: Deepseek在我看来的重大意义

发表于 : 2025年 1月 30日 16:17
(ヅ)
jiml 写了: 2025年 1月 30日 16:14 玩玩可以,商业不可行

一包冻饺子4块钱,你自己手工做,成本加时间20块

手工作坊小批量,无法同工业化量产相比
openai和anthropic据说以后也只发布蒸馏后的模型,原版运行成本太贵赚不了钱

#30 Re: Deepseek在我看来的重大意义

发表于 : 2025年 1月 30日 16:23
jiml
(ヅ) 写了: 2025年 1月 30日 16:17 openai和anthropic据说以后也只发布蒸馏后的模型,原版运行成本太贵赚不了钱
在云里计算肯定比单机便宜

一片b200两千瓦,一个单机四百瓦
算力上比较,按有效算力比,b200是单机的成百上千倍

#31 Re: Deepseek在我看来的重大意义

发表于 : 2025年 1月 30日 17:13
(ヅ)
jiml 写了: 2025年 1月 30日 16:23 在云里计算肯定比单机便宜

一片b200两千瓦,一个单机四百瓦
算力上比较,按有效算力比,b200是单机的成百上千倍
我们说的不是同一个东西

你说的是同一模型云上效率高。我说的是o a两厂有人发现证据并猜测他们不打算公开新的复杂模型,而转而蒸馏出小一点的模型发布,这样省电,更赚钱