doublethink 写了: 今天 04:23现在国产大模型,没有报道解决过Erods问题,或者克努奇问题的。
更别说类似于unit distance的问题。看那些广告没用。以一般推理能力而言,openAI与国产模型有代差。
Anthropic专门训练了安全方面,多半蒸馏了肉人。
Deepseek也部分解决了一个数学问题
doublethink 写了: 今天 04:23现在国产大模型,没有报道解决过Erods问题,或者克努奇问题的。
更别说类似于unit distance的问题。看那些广告没用。以一般推理能力而言,openAI与国产模型有代差。
Anthropic专门训练了安全方面,多半蒸馏了肉人。
Deepseek也部分解决了一个数学问题
doublethink 写了: 今天 04:23现在国产大模型,没有报道解决过Erods问题,或者克努奇问题的。
更别说类似于unit distance的问题。看那些广告没用。以一般推理能力而言,openAI与国产模型有代差。
Anthropic专门训练了安全方面,多半蒸馏了肉人。
有3-6个月差距,所以大家都用领先模型做Erdos
我认为最近围绕法布尔的都是炒作
因为最近A家O家要上市了必须造点势
核心是编程能力
GLM5.2用一个700g的模型基本已经达到了opus4.8的水平
说明土鳖模型的算法,后训练的方法上差距不大
有些地方甚至有优势
据传DeepSeek4.1也有较大进展
唯一明显的劣势是算力,西方的最大模型参数量要大5倍左右
但是算力短时间也很难再scale了
目前大fable级别模型已经不太能release给普通用户,更不要说再scale is0倍
如果大模型把曼哈顿的数据也输进去,确实跟原子弹一样
微软的又不是秃头的钱
hitmantb 写了: 昨天 21:33如果只说/plan完了以后完成80-90%的task, 太多模型都可以。GLM价格真的很贵,付这个钱不如直接上Claude了。
Fable/Opus的强大是产品设计/定位本身,CEO/CTO二合一vs普通程序员的区别。魏老师用Opus好好设计一下他那个产品,Reddit上的人至少能理解他的Value Proposition。
我知道中国大模型没收入,只不过没想到连Cursor的零头都不如,不要说御三家了。说到底要么业界领先,要么出局。
御三家的coding plan都是赔钱的啊,你看看他们一季度亏多少亿吧
hitmantb 写了: 昨天 21:48你是说700B吧,其实GLM因为资源问题,把所有投资都放在了算法上。真的使用起来,跟Opus这种不知道多少T的模型还是有很大区别的。
不支持图片,最简单的直接截图发LLM提要求无法像御三家那么一键完成。内容少,写文案,做产品设计跟Opus有很大差距。Claude公认文笔第一,他做出来的东西有书卷气,哪怕是一篇论文,卖相也要好很多。
对是700B,opus可能是5T,
现在onenshot 编程的都是不太serious的项目
真正product还是human instruct编程
要真像你说的那样,为啥大模型公司花几百万请人?
hitmantb 写了: 昨天 21:33如果只说/plan完了以后完成80-90%的task, 太多模型都可以。GLM价格真的很贵,付这个钱不如直接上Claude了。
Fable/Opus的强大是产品设计/定位本身,CEO/CTO二合一vs普通程序员的区别。魏老师用Opus好好设计一下他那个产品,Reddit上的人至少能理解他的Value Proposition。
模型跟CEO CTO半毛钱关系没有
大公司很多CTO根本不懂技术
CEO比如tim cookern那样更是和稀泥的角色
OPUS这类充其量是对目前流行的模式有不错的记忆。
其实后训练还有很大的空间可以提高
GLM5.2一个700M的模型能达到这样的水平
cursor在kimi2.5基础上训练的coder也非常强
说明主要有后训练数据可以达到或者解决opus的水平
法布尔这个模型无非是拿黑客技术做噱头,其他模型还没有专门训练
doublethink 写了: 昨天 20:07豆包不盈利。
企业服务盈利。看之前我的帖。字节 Seedance 也证明了企业服务这条路走得通。据《晚点 LatePost》了解,字节这款视频生成模型当前年化收入(ARR)已达 20 亿美元(约 143 亿元),单月超 10 亿元——差不多抵消豆包的算力成本。Seedance 绝大多数收入来自企业客户。
国内训练模型的cost不到美国御三家的十分之一。豆包主要收集日常数据
JianguoChuan 写了: 昨天 18:31If openAi cannot sustain to do the 2C business, how DouBao can be profitable?
HuaWei's hardware is cheaper?OpenAi can be profitable in 2030, do you believe it can survive till 2030?
豆包在国内是免费的,豆包即使即使不盈利,作为抖音的护城河有巨大的价值。
而且在AI里面植入广告不难,我让豆包推荐一些商品,他们给的链接都是抖音电商。
这是悲情文,爽文不是很好
豆包的语音识别非常好
基本有99%的正确率
问答常识正确率也不错
现在最大的问题是我需要提醒老人家们这个东西并不是完全正确
成年男女,长期住一起,又没有性生活肯定受不了。
只要文笔好,没问题,译林上面翻译了很多这种畅销书