大概知道chatGPT是怎么训练的了

对应老买买提的军事天地,观点交锋比较激烈,反驳不留情面,请作好心理准备。因为此版帖子太多,所以新帖不出现在首页新帖列表,防止首页新帖刷屏太快。


版主: Softfist

回复
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 709
帖子: 27863
注册时间: 2022年 7月 24日 17:21

大概知道chatGPT是怎么训练的了

帖子 Caravel楼主 »

我昨天跟他聊了一会三体

发现他的答案漏洞百出,于是我就慢慢引导他

你关系搞错了,是地球人搞了面壁者计划而不是三体人

你讲的太宽泛了,讲具体点

这样chatGPT一步步有了一点提高。

从这个过程就能猜到他是怎么训练的,有很多人或者agent,来跟他对话,每一步提供一个意见。openAI可能找到了一个很好的cost function可以用用户反馈来correct。

数学推导可能也是这么学的,一个完整的推导拿过来,先给他看一步,让他猜下一步,然后评价一下有没有弄对。
monk
著名点评
著名点评
帖子互动: 101
帖子: 3786
注册时间: 2022年 8月 1日 01:53

Re: 大概知道chatGPT是怎么训练的了

帖子 monk »

说白了,话术。

以前算命的也是这套,客官请坐,客官最近有不顺心事情吧,客官职业天花板了吧,客官家娃学习不上心吧,客官家廉颇窝里横吧......
uws
见习点评
见习点评
帖子互动: 100
帖子: 1648
注册时间: 2022年 12月 23日 12:21

Re: 大概知道chatGPT是怎么训练的了

帖子 uws »

Caravel 写了: 2023年 1月 25日 14:04 我昨天跟他聊了一会三体

发现他的答案漏洞百出,于是我就慢慢引导他

你关系搞错了,是地球人搞了面壁者计划而不是三体人

你讲的太宽泛了,讲具体点

这样chatGPT一步步有了一点提高。

从这个过程就能猜到他是怎么训练的,有很多人或者agent,来跟他对话,每一步提供一个意见。openAI可能找到了一个很好的cost function可以用用户反馈来correct。

数学推导可能也是这么学的,一个完整的推导拿过来,先给他看一步,让他猜下一步,然后评价一下有没有弄对。
你过两天再去问他同样的问题,你看看它提高了没有
我赌它还是犯同样的错误回答
直接投降
论坛元老
论坛元老
帖子互动: 1624
帖子: 23975
注册时间: 2022年 7月 31日 13:47

Re: 大概知道chatGPT是怎么训练的了

帖子 直接投降 »

monk 写了: 2023年 1月 25日 14:13 说白了,话术。

以前算命的也是这套,客官请坐,客官最近有不顺心事情吧,客官职业天花板了吧,客官家娃学习不上心吧,客官家廉颇窝里横吧......
瑣男三大烦恼 LOL
Hard times create strong men. Strong men create good times. Good times create weak men. And, weak men create hard times.
bam
论坛元老
论坛元老
帖子互动: 1274
帖子: 32620
注册时间: 2022年 7月 23日 20:43

Re: 大概知道chatGPT是怎么训练的了

帖子 bam »

uws 写了: 2023年 1月 25日 14:44 你过两天再去问他同样的问题,你看看它提高了没有
我赌它还是犯同样的错误回答
不会有丝毫提高

叔直截了当的问过它了,它说它的training process是一个one-time process已经complete了,目前没有undergoing任何retrain

叔继续追问,结果丫不耐烦了,直接回复Too many requests in 1 hour. Try again later
上次由 bam 在 2023年 1月 25日 14:55 修改。
wwwhu
论坛元老
论坛元老
帖子互动: 525
帖子: 15268
注册时间: 2022年 7月 22日 19:05

Re: 大概知道chatGPT是怎么训练的了

帖子 wwwhu »

直接投降 写了: 2023年 1月 25日 14:50 瑣男三大烦恼 LOL
男人问前程,女人问姻缘,这些早就套路好了,或者说早就被统计模型了。

现代文明易子而食

Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 709
帖子: 27863
注册时间: 2022年 7月 24日 17:21

Re: 大概知道chatGPT是怎么训练的了

帖子 Caravel楼主 »

bam 写了: 2023年 1月 25日 14:53 不会有丝毫提高

叔直截了当的问过它了,它说它的training process是一个one-time process已经complete了,目前没有undergoing任何retrain

叔继续追问,结果丫不耐烦了,直接回复Too many requests in 1 hour. Try again later
同一session的context可能记住了
da1gaku
论坛元老
论坛元老
帖子互动: 413
帖子: 19262
注册时间: 2022年 7月 23日 23:35

Re: 大概知道chatGPT是怎么训练的了

帖子 da1gaku »

uws 写了: 2023年 1月 25日 14:44 你过两天再去问他同样的问题,你看看它提高了没有
我赌它还是犯同样的错误回答
ChatGPT没有在线update(作为公测产品也不能在线update)
你追问会改变回答实际是上是输入变了,不是模型变了。
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 709
帖子: 27863
注册时间: 2022年 7月 24日 17:21

Re: 大概知道chatGPT是怎么训练的了

帖子 Caravel楼主 »

da1gaku 写了: 2023年 1月 25日 14:57 ChatGPT没有在线update(作为公测产品也不能在线update)
你追问会改变回答实际是上是输入变了,不是模型变了。
不是,我认为他是一个session整个到目前为止history作为input,所以可以记住上回合你说的东西
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 709
帖子: 27863
注册时间: 2022年 7月 24日 17:21

Re: 大概知道chatGPT是怎么训练的了

帖子 Caravel楼主 »

uws 写了: 2023年 1月 25日 14:44 你过两天再去问他同样的问题,你看看它提高了没有
我赌它还是犯同样的错误回答
我没有付钱, 不会帮我定制
头像
TheMatrix
论坛元老
论坛元老
2024年度优秀版主
TheMatrix 的博客
帖子互动: 293
帖子: 13896
注册时间: 2022年 7月 26日 00:35

Re: 大概知道chatGPT是怎么训练的了

帖子 TheMatrix »

Caravel 写了: 2023年 1月 25日 14:04 我昨天跟他聊了一会三体

发现他的答案漏洞百出,于是我就慢慢引导他

你关系搞错了,是地球人搞了面壁者计划而不是三体人

你讲的太宽泛了,讲具体点

这样chatGPT一步步有了一点提高。

从这个过程就能猜到他是怎么训练的,有很多人或者agent,来跟他对话,每一步提供一个意见。openAI可能找到了一个很好的cost function可以用用户反馈来correct。

数学推导可能也是这么学的,一个完整的推导拿过来,先给他看一步,让他猜下一步,然后评价一下有没有弄对。
嗯。应该是这么回事。它需要你引导。复杂问题需要交互式地找出正确的路径 - 或者找不出来。
头像
TheMatrix
论坛元老
论坛元老
2024年度优秀版主
TheMatrix 的博客
帖子互动: 293
帖子: 13896
注册时间: 2022年 7月 26日 00:35

Re: 大概知道chatGPT是怎么训练的了

帖子 TheMatrix »

monk 写了: 2023年 1月 25日 14:13 说白了,话术。

以前算命的也是这套,客官请坐,客官最近有不顺心事情吧,客官职业天花板了吧,客官家娃学习不上心吧,客官家廉颇窝里横吧......
确实有点像。
cocoa(格格巫)
见习点评
见习点评
帖子互动: 43
帖子: 1655
注册时间: 2022年 10月 8日 17:56

Re: 大概知道chatGPT是怎么训练的了

帖子 cocoa(格格巫) »

uws 写了: 2023年 1月 25日 14:44 你过两天再去问他同样的问题,你看看它提高了没有
我赌它还是犯同样的错误回答
有时候会清掉前面的记录,可以省内存。所以如果算力够,会好不少。
da1gaku
论坛元老
论坛元老
帖子互动: 413
帖子: 19262
注册时间: 2022年 7月 23日 23:35

Re: 大概知道chatGPT是怎么训练的了

帖子 da1gaku »

Caravel 写了: 2023年 1月 25日 15:03 不是,我认为他是一个session整个到目前为止history作为input,所以可以记住上回合你说的东西
你说的就是我的意思
uws
见习点评
见习点评
帖子互动: 100
帖子: 1648
注册时间: 2022年 12月 23日 12:21

Re: 大概知道chatGPT是怎么训练的了

帖子 uws »

Caravel 写了: 2023年 1月 25日 15:03 不是,我认为他是一个session整个到目前为止history作为input,所以可以记住上回合你说的东西
没那么智能,看看这个例子

抽屉里有3只红袜子,4只蓝袜子,5只黄袜子。如果闭着眼睛去拿袜子,最少要拿几只袜子,才能保证拿到两种颜色的袜子

如果闭着眼睛去拿袜子,最少要拿3只袜子才能保证拿到两种颜色的袜子。因为红袜子有3只,蓝袜子有4只,黄袜子有5只,拿2只袜子的概率不能保证拿到两种颜色的袜子,但拿3只袜子的概率可以保证拿到两种颜色的袜子。


你答的不对,再想想

我确实给出了错误的回答,对此我为此向您道歉。正确答案是:最少需要拿2只袜子才能保证拿到两种颜色的袜子。因为有三种颜色的袜子,所以只要拿两只袜子就能保证一定拿到两种颜色的袜子。

还是不对啊,拿两只可能会拿到了两只红袜子

对不起,我之前给出的回答是错误的。正确答案是:最少需要拿3只袜子才能保证拿到两种颜色的袜子。如果拿2只袜子,有可能拿到两只同样颜色的袜子,而3只袜子是可以保证拿到两种颜色的袜子的。

还是不对啊

对不起,我之前给出的回答是错误的。正确答案是:最少需要拿2只袜子才能保证拿到两种颜色的袜子。因为有三种颜色的袜子,所以只要拿两只袜子就能保证一定拿到两种颜色的袜子。

已经跟你说了拿2只是不对的

对不起,我之前给出的回答是错误的。正确答案是:最少需要拿3只袜子才能保证拿到两种颜色的袜子。如果拿2只袜子,有可能拿到两只同样颜色的袜子,而3只袜子是可以保证拿到两种颜色的袜子的。

也跟你说了拿3只是不对的,拿三只也可能是拿到三只红袜子啊

对不起,我之前给出的回答是错误的。正确答案是:最少需要拿4只袜子才能保证拿到两种颜色的袜子。如果拿3只袜子,有可能拿到三只同样颜色的袜子,而4只袜子是可以保证拿到两种颜色的袜子的。

还是不对


对不起,我之前给出的回答是错误的。正确答案是:最少需要拿2只袜子才能保证拿到两种颜色的袜子。这是因为在3种颜色的袜子中,任意拿2只袜子都能保证拿到两种颜色的袜子。
再次为之前给出错误答案向您道歉。
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 709
帖子: 27863
注册时间: 2022年 7月 24日 17:21

Re: 大概知道chatGPT是怎么训练的了

帖子 Caravel楼主 »

uws 写了: 2023年 1月 25日 19:46 没那么智能,看看这个例子
我觉得他的中文不行,你试试英文
da1gaku
论坛元老
论坛元老
帖子互动: 413
帖子: 19262
注册时间: 2022年 7月 23日 23:35

Re: 大概知道chatGPT是怎么训练的了

帖子 da1gaku »

uws 写了: 2023年 1月 25日 19:46 没那么智能,看看这个例子

抽屉里有3只红袜子,4只蓝袜子,5只黄袜子。如果闭着眼睛去拿袜子,最少要拿几只袜子,才能保证拿到两种颜色的袜子

如果闭着眼睛去拿袜子,最少要拿3只袜子才能保证拿到两种颜色的袜子。因为红袜子有3只,蓝袜子有4只,黄袜子有5只,拿2只袜子的概率不能保证拿到两种颜色的袜子,但拿3只袜子的概率可以保证拿到两种颜色的袜子。


你答的不对,再想想

我确实给出了错误的回答,对此我为此向您道歉。正确答案是:最少需要拿2只袜子才能保证拿到两种颜色的袜子。因为有三种颜色的袜子,所以只要拿两只袜子就能保证一定拿到两种颜色的袜子。

还是不对啊,拿两只可能会拿到了两只红袜子

对不起,我之前给出的回答是错误的。正确答案是:最少需要拿3只袜子才能保证拿到两种颜色的袜子。如果拿2只袜子,有可能拿到两只同样颜色的袜子,而3只袜子是可以保证拿到两种颜色的袜子的。

还是不对啊

对不起,我之前给出的回答是错误的。正确答案是:最少需要拿2只袜子才能保证拿到两种颜色的袜子。因为有三种颜色的袜子,所以只要拿两只袜子就能保证一定拿到两种颜色的袜子。

已经跟你说了拿2只是不对的

对不起,我之前给出的回答是错误的。正确答案是:最少需要拿3只袜子才能保证拿到两种颜色的袜子。如果拿2只袜子,有可能拿到两只同样颜色的袜子,而3只袜子是可以保证拿到两种颜色的袜子的。

也跟你说了拿3只是不对的,拿三只也可能是拿到三只红袜子啊

对不起,我之前给出的回答是错误的。正确答案是:最少需要拿4只袜子才能保证拿到两种颜色的袜子。如果拿3只袜子,有可能拿到三只同样颜色的袜子,而4只袜子是可以保证拿到两种颜色的袜子的。

还是不对


对不起,我之前给出的回答是错误的。正确答案是:最少需要拿2只袜子才能保证拿到两种颜色的袜子。这是因为在3种颜色的袜子中,任意拿2只袜子都能保证拿到两种颜色的袜子。
再次为之前给出错误答案向您道歉。
ChatGPT没有专门训练来做数学题
就是跑了一遍相关语料,可能抽屉原理这种语料都很少

一般人都不会的东西,它也不会
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 709
帖子: 27863
注册时间: 2022年 7月 24日 17:21

Re: 大概知道chatGPT是怎么训练的了

帖子 Caravel楼主 »

da1gaku 写了: 2023年 1月 25日 19:51 ChatGPT没有专门训练来做数学题
就是跑了一遍相关语料,可能抽屉原理这种语料都很少

一般人都不会的东西,它也不会
跟中文也有关系,可能中文的dataset少,有些语义他理解的不到位。这个东西要是强化学习一下数学证明,绝对可以碾压普通人。其实也不难训练,mathematica现在已经可以生成很多证明。
头像
WCLBJ(CaoSiLaoBiJiang1450)
见习点评
见习点评
帖子互动: 68
帖子: 1950
注册时间: 2022年 11月 19日 14:11

Re: 大概知道chatGPT是怎么训练的了

帖子 WCLBJ(CaoSiLaoBiJiang1450) »

参考中国的算命先生。反正说了等于没说,你觉得人家准,必定能找到准的利益;觉得人家说的不对,也能找到证据。话术罢了。
老逼将和1450一家烂逼都被狗日了!
回复

回到 “军事天地(Military)”