老牛一般不评论西爱死的东西。这次作为对能教授的支持说两句。如果老牛哪里理解错误欢迎指正。
1/ 大家应该先去读一下梁团队的论文再讨论。
2/ 老牛的理解是梁团队的“成功”在于应用了一个group方法。这个方法提出了几个月。作者是位老中。
2a/ 老牛不清楚这位老中是不是梁团队的
2b/ 梁团队一大贡献是花了500万验证并公布了有效性
2c/ 没有根据OpenAi或Meta或其它公司如xAi不知道这篇文章这个“新”方法。甚至有可能OpenAi已经用了这方法。
3/ 500万不是从零开始训练成本。而是在已有大模型基础上的训练一个小模型?的成本。这是第一个不严谨会引起质疑的地方。
4/ R1并不小,671b参数。而OpenAi的o1老牛找到的说是200-300b。不理解为什么说R1比o1运行成本低(那么多)。这是第二个不严谨会引起质疑的地方。
按学术标准。以上两点是警钟。
5/ 为什么不和o3比。o1属于上一代产品了。