大概知道chatGPT是怎么训练的了

Caravel · 帖子由 **Caravel楼主** » 2023年 1月 25日 14:04

我昨天跟他聊了一会三体

发现他的答案漏洞百出，于是我就慢慢引导他

你关系搞错了，是地球人搞了面壁者计划而不是三体人

你讲的太宽泛了，讲具体点

这样chatGPT一步步有了一点提高。

从这个过程就能猜到他是怎么训练的，有很多人或者agent，来跟他对话，每一步提供一个意见。openAI可能找到了一个很好的cost function可以用用户反馈来correct。

数学推导可能也是这么学的，一个完整的推导拿过来，先给他看一步，让他猜下一步，然后评价一下有没有弄对。

monk · 帖子由 **monk** » 2023年 1月 25日 14:13

说白了，话术。

以前算命的也是这套，客官请坐，客官最近有不顺心事情吧，客官职业天花板了吧，客官家娃学习不上心吧，客官家廉颇窝里横吧......

uws · 帖子由 **uws** » 2023年 1月 25日 14:44

Caravel 写了： 2023年 1月 25日 14:04 我昨天跟他聊了一会三体

发现他的答案漏洞百出，于是我就慢慢引导他

你关系搞错了，是地球人搞了面壁者计划而不是三体人

你讲的太宽泛了，讲具体点

这样chatGPT一步步有了一点提高。

从这个过程就能猜到他是怎么训练的，有很多人或者agent，来跟他对话，每一步提供一个意见。openAI可能找到了一个很好的cost function可以用用户反馈来correct。

数学推导可能也是这么学的，一个完整的推导拿过来，先给他看一步，让他猜下一步，然后评价一下有没有弄对。

你过两天再去问他同样的问题，你看看它提高了没有
我赌它还是犯同样的错误回答

直接投降 · 帖子由 **直接投降** » 2023年 1月 25日 14:50

monk 写了： 2023年 1月 25日 14:13 说白了，话术。

以前算命的也是这套，客官请坐，客官最近有不顺心事情吧，客官职业天花板了吧，客官家娃学习不上心吧，客官家廉颇窝里横吧......

瑣男三大烦恼 LOL

bam · 帖子由 **bam** » 2023年 1月 25日 14:53

uws 写了： 2023年 1月 25日 14:44 你过两天再去问他同样的问题，你看看它提高了没有
我赌它还是犯同样的错误回答

不会有丝毫提高

叔直截了当的问过它了，它说它的training process是一个one-time process已经complete了，目前没有undergoing任何retrain

叔继续追问，结果丫不耐烦了，直接回复Too many requests in 1 hour. Try again later

wwwhu · 帖子由 **wwwhu** » 2023年 1月 25日 14:54

直接投降写了： 2023年 1月 25日 14:50 瑣男三大烦恼 LOL

男人问前程，女人问姻缘，这些早就套路好了，或者说早就被统计模型了。

Caravel · 帖子由 **Caravel楼主** » 2023年 1月 25日 14:55

bam 写了： 2023年 1月 25日 14:53 不会有丝毫提高

叔直截了当的问过它了，它说它的training process是一个one-time process已经complete了，目前没有undergoing任何retrain

叔继续追问，结果丫不耐烦了，直接回复Too many requests in 1 hour. Try again later

同一session的context可能记住了

da1gaku · 帖子由 **da1gaku** » 2023年 1月 25日 14:57

uws 写了： 2023年 1月 25日 14:44 你过两天再去问他同样的问题，你看看它提高了没有
我赌它还是犯同样的错误回答

ChatGPT没有在线update（作为公测产品也不能在线update）
你追问会改变回答实际是上是输入变了，不是模型变了。

Caravel · 帖子由 **Caravel楼主** » 2023年 1月 25日 15:03

da1gaku 写了： 2023年 1月 25日 14:57 ChatGPT没有在线update（作为公测产品也不能在线update）
你追问会改变回答实际是上是输入变了，不是模型变了。

不是，我认为他是一个session整个到目前为止history作为input，所以可以记住上回合你说的东西

Caravel · 帖子由 **Caravel楼主** » 2023年 1月 25日 15:08

uws 写了： 2023年 1月 25日 14:44 你过两天再去问他同样的问题，你看看它提高了没有
我赌它还是犯同样的错误回答

我没有付钱, 不会帮我定制

TheMatrix · 帖子由 **TheMatrix** » 2023年 1月 25日 15:08

Caravel 写了： 2023年 1月 25日 14:04 我昨天跟他聊了一会三体

发现他的答案漏洞百出，于是我就慢慢引导他

你关系搞错了，是地球人搞了面壁者计划而不是三体人

你讲的太宽泛了，讲具体点

这样chatGPT一步步有了一点提高。

从这个过程就能猜到他是怎么训练的，有很多人或者agent，来跟他对话，每一步提供一个意见。openAI可能找到了一个很好的cost function可以用用户反馈来correct。

数学推导可能也是这么学的，一个完整的推导拿过来，先给他看一步，让他猜下一步，然后评价一下有没有弄对。

嗯。应该是这么回事。它需要你引导。复杂问题需要交互式地找出正确的路径 - 或者找不出来。

TheMatrix · 帖子由 **TheMatrix** » 2023年 1月 25日 15:09

monk 写了： 2023年 1月 25日 14:13 说白了，话术。

以前算命的也是这套，客官请坐，客官最近有不顺心事情吧，客官职业天花板了吧，客官家娃学习不上心吧，客官家廉颇窝里横吧......

确实有点像。

cocoa

uws 写了： 2023年 1月 25日 14:44 你过两天再去问他同样的问题，你看看它提高了没有
我赌它还是犯同样的错误回答

有时候会清掉前面的记录，可以省内存。所以如果算力够，会好不少。

da1gaku · 帖子由 **da1gaku** » 2023年 1月 25日 15:28

Caravel 写了： 2023年 1月 25日 15:03 不是，我认为他是一个session整个到目前为止history作为input，所以可以记住上回合你说的东西

你说的就是我的意思

uws · 帖子由 **uws** » 2023年 1月 25日 19:46

Caravel 写了： 2023年 1月 25日 15:03 不是，我认为他是一个session整个到目前为止history作为input，所以可以记住上回合你说的东西

没那么智能，看看这个例子

抽屉里有3只红袜子，4只蓝袜子，5只黄袜子。如果闭着眼睛去拿袜子，最少要拿几只袜子，才能保证拿到两种颜色的袜子

如果闭着眼睛去拿袜子，最少要拿3只袜子才能保证拿到两种颜色的袜子。因为红袜子有3只，蓝袜子有4只，黄袜子有5只，拿2只袜子的概率不能保证拿到两种颜色的袜子，但拿3只袜子的概率可以保证拿到两种颜色的袜子。

你答的不对，再想想

我确实给出了错误的回答，对此我为此向您道歉。正确答案是：最少需要拿2只袜子才能保证拿到两种颜色的袜子。因为有三种颜色的袜子，所以只要拿两只袜子就能保证一定拿到两种颜色的袜子。

还是不对啊，拿两只可能会拿到了两只红袜子

对不起，我之前给出的回答是错误的。正确答案是：最少需要拿3只袜子才能保证拿到两种颜色的袜子。如果拿2只袜子，有可能拿到两只同样颜色的袜子，而3只袜子是可以保证拿到两种颜色的袜子的。

还是不对啊

对不起，我之前给出的回答是错误的。正确答案是：最少需要拿2只袜子才能保证拿到两种颜色的袜子。因为有三种颜色的袜子，所以只要拿两只袜子就能保证一定拿到两种颜色的袜子。

已经跟你说了拿2只是不对的

对不起，我之前给出的回答是错误的。正确答案是：最少需要拿3只袜子才能保证拿到两种颜色的袜子。如果拿2只袜子，有可能拿到两只同样颜色的袜子，而3只袜子是可以保证拿到两种颜色的袜子的。

也跟你说了拿3只是不对的，拿三只也可能是拿到三只红袜子啊

对不起，我之前给出的回答是错误的。正确答案是：最少需要拿4只袜子才能保证拿到两种颜色的袜子。如果拿3只袜子，有可能拿到三只同样颜色的袜子，而4只袜子是可以保证拿到两种颜色的袜子的。

还是不对

对不起，我之前给出的回答是错误的。正确答案是：最少需要拿2只袜子才能保证拿到两种颜色的袜子。这是因为在3种颜色的袜子中,任意拿2只袜子都能保证拿到两种颜色的袜子。
再次为之前给出错误答案向您道歉。

Caravel · 帖子由 **Caravel楼主** » 2023年 1月 25日 19:50

uws 写了： 2023年 1月 25日 19:46 没那么智能，看看这个例子

我觉得他的中文不行，你试试英文

da1gaku · 帖子由 **da1gaku** » 2023年 1月 25日 19:51

uws 写了： 2023年 1月 25日 19:46 没那么智能，看看这个例子

抽屉里有3只红袜子，4只蓝袜子，5只黄袜子。如果闭着眼睛去拿袜子，最少要拿几只袜子，才能保证拿到两种颜色的袜子

如果闭着眼睛去拿袜子，最少要拿3只袜子才能保证拿到两种颜色的袜子。因为红袜子有3只，蓝袜子有4只，黄袜子有5只，拿2只袜子的概率不能保证拿到两种颜色的袜子，但拿3只袜子的概率可以保证拿到两种颜色的袜子。

你答的不对，再想想

我确实给出了错误的回答，对此我为此向您道歉。正确答案是：最少需要拿2只袜子才能保证拿到两种颜色的袜子。因为有三种颜色的袜子，所以只要拿两只袜子就能保证一定拿到两种颜色的袜子。

还是不对啊，拿两只可能会拿到了两只红袜子

对不起，我之前给出的回答是错误的。正确答案是：最少需要拿3只袜子才能保证拿到两种颜色的袜子。如果拿2只袜子，有可能拿到两只同样颜色的袜子，而3只袜子是可以保证拿到两种颜色的袜子的。

还是不对啊

对不起，我之前给出的回答是错误的。正确答案是：最少需要拿2只袜子才能保证拿到两种颜色的袜子。因为有三种颜色的袜子，所以只要拿两只袜子就能保证一定拿到两种颜色的袜子。

已经跟你说了拿2只是不对的

对不起，我之前给出的回答是错误的。正确答案是：最少需要拿3只袜子才能保证拿到两种颜色的袜子。如果拿2只袜子，有可能拿到两只同样颜色的袜子，而3只袜子是可以保证拿到两种颜色的袜子的。

也跟你说了拿3只是不对的，拿三只也可能是拿到三只红袜子啊

对不起，我之前给出的回答是错误的。正确答案是：最少需要拿4只袜子才能保证拿到两种颜色的袜子。如果拿3只袜子，有可能拿到三只同样颜色的袜子，而4只袜子是可以保证拿到两种颜色的袜子的。

还是不对

对不起，我之前给出的回答是错误的。正确答案是：最少需要拿2只袜子才能保证拿到两种颜色的袜子。这是因为在3种颜色的袜子中,任意拿2只袜子都能保证拿到两种颜色的袜子。
再次为之前给出错误答案向您道歉。

ChatGPT没有专门训练来做数学题
就是跑了一遍相关语料，可能抽屉原理这种语料都很少

一般人都不会的东西，它也不会

Caravel · 帖子由 **Caravel楼主** » 2023年 1月 25日 20:29

da1gaku 写了： 2023年 1月 25日 19:51 ChatGPT没有专门训练来做数学题
就是跑了一遍相关语料，可能抽屉原理这种语料都很少

一般人都不会的东西，它也不会

跟中文也有关系，可能中文的dataset少，有些语义他理解的不到位。这个东西要是强化学习一下数学证明，绝对可以碾压普通人。其实也不难训练，mathematica现在已经可以生成很多证明。

WCLBJ

参考中国的算命先生。反正说了等于没说，你觉得人家准，必定能找到准的利益；觉得人家说的不对，也能找到证据。话术罢了。

新未名空间

大概知道chatGPT是怎么训练的了

大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了

Re: 大概知道chatGPT是怎么训练的了