目前还是需要O1和R1一起用
版主: hci
-
Caravel
- 论坛元老

Caravel 的博客 - 帖子互动: 708
- 帖子: 27826
- 注册时间: 2022年 7月 24日 17:21
#3 Re: 目前还是需要O1和R1一起用
估计是oai的训练数据质量更高hci 写了: 2025年 1月 28日 15:49 目前的经验是,O1的知识面更广,R1的推理能力似乎要更强些。两者能够互补,各自出一些主意,合在一起,才能解决疑难杂症。
其实就是两个实习生的作用。一个实习生不够,得两个,加上肉人老司机,三个臭皮匠,基本就无往而不胜了。
oai的推理训练是RL么,没人知道
-
Caravel
- 论坛元老

Caravel 的博客 - 帖子互动: 708
- 帖子: 27826
- 注册时间: 2022年 7月 24日 17:21
#4 Re: 目前还是需要O1和R1一起用
这两天你怎么如此低调?hci 写了: 2025年 1月 28日 15:49 目前的经验是,O1的知识面更广,R1的推理能力似乎要更强些。两者能够互补,各自出一些主意,合在一起,才能解决疑难杂症。
其实就是两个实习生的作用。一个实习生不够,得两个,加上肉人老司机,三个臭皮匠,基本就无往而不胜了。
你和wdong是正经做AI的,没有来讨论DS
-
stonesthat(stones)
- 著名写手

- 帖子互动: 19
- 帖子: 218
- 注册时间: 2023年 11月 7日 14:31

