大概知道chatGPT是怎么训练的了
版主: Softfist
-
Caravel楼主
- 论坛元老

Caravel 的博客 - 帖子互动: 709
- 帖子: 27863
- 注册时间: 2022年 7月 24日 17:21
大概知道chatGPT是怎么训练的了
我昨天跟他聊了一会三体
发现他的答案漏洞百出,于是我就慢慢引导他
你关系搞错了,是地球人搞了面壁者计划而不是三体人
你讲的太宽泛了,讲具体点
这样chatGPT一步步有了一点提高。
从这个过程就能猜到他是怎么训练的,有很多人或者agent,来跟他对话,每一步提供一个意见。openAI可能找到了一个很好的cost function可以用用户反馈来correct。
数学推导可能也是这么学的,一个完整的推导拿过来,先给他看一步,让他猜下一步,然后评价一下有没有弄对。
发现他的答案漏洞百出,于是我就慢慢引导他
你关系搞错了,是地球人搞了面壁者计划而不是三体人
你讲的太宽泛了,讲具体点
这样chatGPT一步步有了一点提高。
从这个过程就能猜到他是怎么训练的,有很多人或者agent,来跟他对话,每一步提供一个意见。openAI可能找到了一个很好的cost function可以用用户反馈来correct。
数学推导可能也是这么学的,一个完整的推导拿过来,先给他看一步,让他猜下一步,然后评价一下有没有弄对。
Re: 大概知道chatGPT是怎么训练的了
你过两天再去问他同样的问题,你看看它提高了没有Caravel 写了: 2023年 1月 25日 14:04 我昨天跟他聊了一会三体
发现他的答案漏洞百出,于是我就慢慢引导他
你关系搞错了,是地球人搞了面壁者计划而不是三体人
你讲的太宽泛了,讲具体点
这样chatGPT一步步有了一点提高。
从这个过程就能猜到他是怎么训练的,有很多人或者agent,来跟他对话,每一步提供一个意见。openAI可能找到了一个很好的cost function可以用用户反馈来correct。
数学推导可能也是这么学的,一个完整的推导拿过来,先给他看一步,让他猜下一步,然后评价一下有没有弄对。
我赌它还是犯同样的错误回答
Re: 大概知道chatGPT是怎么训练的了
瑣男三大烦恼 LOL
Hard times create strong men. Strong men create good times. Good times create weak men. And, weak men create hard times.
Re: 大概知道chatGPT是怎么训练的了
不会有丝毫提高
叔直截了当的问过它了,它说它的training process是一个one-time process已经complete了,目前没有undergoing任何retrain
叔继续追问,结果丫不耐烦了,直接回复Too many requests in 1 hour. Try again later
上次由 bam 在 2023年 1月 25日 14:55 修改。
-
Caravel楼主
- 论坛元老

Caravel 的博客 - 帖子互动: 709
- 帖子: 27863
- 注册时间: 2022年 7月 24日 17:21
Re: 大概知道chatGPT是怎么训练的了
同一session的context可能记住了bam 写了: 2023年 1月 25日 14:53 不会有丝毫提高
叔直截了当的问过它了,它说它的training process是一个one-time process已经complete了,目前没有undergoing任何retrain
叔继续追问,结果丫不耐烦了,直接回复Too many requests in 1 hour. Try again later
-
Caravel楼主
- 论坛元老

Caravel 的博客 - 帖子互动: 709
- 帖子: 27863
- 注册时间: 2022年 7月 24日 17:21
-
Caravel楼主
- 论坛元老

Caravel 的博客 - 帖子互动: 709
- 帖子: 27863
- 注册时间: 2022年 7月 24日 17:21
-
TheMatrix
- 论坛元老

2024年度优秀版主
TheMatrix 的博客 - 帖子互动: 293
- 帖子: 13896
- 注册时间: 2022年 7月 26日 00:35
Re: 大概知道chatGPT是怎么训练的了
嗯。应该是这么回事。它需要你引导。复杂问题需要交互式地找出正确的路径 - 或者找不出来。Caravel 写了: 2023年 1月 25日 14:04 我昨天跟他聊了一会三体
发现他的答案漏洞百出,于是我就慢慢引导他
你关系搞错了,是地球人搞了面壁者计划而不是三体人
你讲的太宽泛了,讲具体点
这样chatGPT一步步有了一点提高。
从这个过程就能猜到他是怎么训练的,有很多人或者agent,来跟他对话,每一步提供一个意见。openAI可能找到了一个很好的cost function可以用用户反馈来correct。
数学推导可能也是这么学的,一个完整的推导拿过来,先给他看一步,让他猜下一步,然后评价一下有没有弄对。
-
TheMatrix
- 论坛元老

2024年度优秀版主
TheMatrix 的博客 - 帖子互动: 293
- 帖子: 13896
- 注册时间: 2022年 7月 26日 00:35
Re: 大概知道chatGPT是怎么训练的了
没那么智能,看看这个例子
抽屉里有3只红袜子,4只蓝袜子,5只黄袜子。如果闭着眼睛去拿袜子,最少要拿几只袜子,才能保证拿到两种颜色的袜子
如果闭着眼睛去拿袜子,最少要拿3只袜子才能保证拿到两种颜色的袜子。因为红袜子有3只,蓝袜子有4只,黄袜子有5只,拿2只袜子的概率不能保证拿到两种颜色的袜子,但拿3只袜子的概率可以保证拿到两种颜色的袜子。
你答的不对,再想想
我确实给出了错误的回答,对此我为此向您道歉。正确答案是:最少需要拿2只袜子才能保证拿到两种颜色的袜子。因为有三种颜色的袜子,所以只要拿两只袜子就能保证一定拿到两种颜色的袜子。
还是不对啊,拿两只可能会拿到了两只红袜子
对不起,我之前给出的回答是错误的。正确答案是:最少需要拿3只袜子才能保证拿到两种颜色的袜子。如果拿2只袜子,有可能拿到两只同样颜色的袜子,而3只袜子是可以保证拿到两种颜色的袜子的。
还是不对啊
对不起,我之前给出的回答是错误的。正确答案是:最少需要拿2只袜子才能保证拿到两种颜色的袜子。因为有三种颜色的袜子,所以只要拿两只袜子就能保证一定拿到两种颜色的袜子。
已经跟你说了拿2只是不对的
对不起,我之前给出的回答是错误的。正确答案是:最少需要拿3只袜子才能保证拿到两种颜色的袜子。如果拿2只袜子,有可能拿到两只同样颜色的袜子,而3只袜子是可以保证拿到两种颜色的袜子的。
也跟你说了拿3只是不对的,拿三只也可能是拿到三只红袜子啊
对不起,我之前给出的回答是错误的。正确答案是:最少需要拿4只袜子才能保证拿到两种颜色的袜子。如果拿3只袜子,有可能拿到三只同样颜色的袜子,而4只袜子是可以保证拿到两种颜色的袜子的。
还是不对
对不起,我之前给出的回答是错误的。正确答案是:最少需要拿2只袜子才能保证拿到两种颜色的袜子。这是因为在3种颜色的袜子中,任意拿2只袜子都能保证拿到两种颜色的袜子。
再次为之前给出错误答案向您道歉。
-
Caravel楼主
- 论坛元老

Caravel 的博客 - 帖子互动: 709
- 帖子: 27863
- 注册时间: 2022年 7月 24日 17:21
Re: 大概知道chatGPT是怎么训练的了
ChatGPT没有专门训练来做数学题uws 写了: 2023年 1月 25日 19:46 没那么智能,看看这个例子
抽屉里有3只红袜子,4只蓝袜子,5只黄袜子。如果闭着眼睛去拿袜子,最少要拿几只袜子,才能保证拿到两种颜色的袜子
如果闭着眼睛去拿袜子,最少要拿3只袜子才能保证拿到两种颜色的袜子。因为红袜子有3只,蓝袜子有4只,黄袜子有5只,拿2只袜子的概率不能保证拿到两种颜色的袜子,但拿3只袜子的概率可以保证拿到两种颜色的袜子。
你答的不对,再想想
我确实给出了错误的回答,对此我为此向您道歉。正确答案是:最少需要拿2只袜子才能保证拿到两种颜色的袜子。因为有三种颜色的袜子,所以只要拿两只袜子就能保证一定拿到两种颜色的袜子。
还是不对啊,拿两只可能会拿到了两只红袜子
对不起,我之前给出的回答是错误的。正确答案是:最少需要拿3只袜子才能保证拿到两种颜色的袜子。如果拿2只袜子,有可能拿到两只同样颜色的袜子,而3只袜子是可以保证拿到两种颜色的袜子的。
还是不对啊
对不起,我之前给出的回答是错误的。正确答案是:最少需要拿2只袜子才能保证拿到两种颜色的袜子。因为有三种颜色的袜子,所以只要拿两只袜子就能保证一定拿到两种颜色的袜子。
已经跟你说了拿2只是不对的
对不起,我之前给出的回答是错误的。正确答案是:最少需要拿3只袜子才能保证拿到两种颜色的袜子。如果拿2只袜子,有可能拿到两只同样颜色的袜子,而3只袜子是可以保证拿到两种颜色的袜子的。
也跟你说了拿3只是不对的,拿三只也可能是拿到三只红袜子啊
对不起,我之前给出的回答是错误的。正确答案是:最少需要拿4只袜子才能保证拿到两种颜色的袜子。如果拿3只袜子,有可能拿到三只同样颜色的袜子,而4只袜子是可以保证拿到两种颜色的袜子的。
还是不对
对不起,我之前给出的回答是错误的。正确答案是:最少需要拿2只袜子才能保证拿到两种颜色的袜子。这是因为在3种颜色的袜子中,任意拿2只袜子都能保证拿到两种颜色的袜子。
再次为之前给出错误答案向您道歉。
就是跑了一遍相关语料,可能抽屉原理这种语料都很少
一般人都不会的东西,它也不会
-
Caravel楼主
- 论坛元老

Caravel 的博客 - 帖子互动: 709
- 帖子: 27863
- 注册时间: 2022年 7月 24日 17:21
Re: 大概知道chatGPT是怎么训练的了
跟中文也有关系,可能中文的dataset少,有些语义他理解的不到位。这个东西要是强化学习一下数学证明,绝对可以碾压普通人。其实也不难训练,mathematica现在已经可以生成很多证明。

