ChatGPT这回考砸了

版主: kazaawangwh

wh楼主
论坛元老
论坛元老
wh 的博客
帖子: 30815
注册时间: 7月 28, 2022, 12:07 am
昵称(选填): 问号

ChatGPT这回考砸了

帖子 wh楼主 »

转:这回ChatGPT栽了

ChatGPT自出道以来,所向披靡,可谓是“人挡杀人,佛挡杀佛”。它先后通过了宾大商学院 Wharton MBA考试,律师的 Bar Exam等考试。

据 “今日会计”(Accounting Today)报道, 4月13日,有好事者在纽约用了两台分别装有 ChatGPT 3.5 Pro account的笔记本电脑,各自参加了两门美国注册会计师CPA的考试。结果如何呢?

这是它们“哥俩”的成绩:
1. Reg (法规) 39%
2. Aud (审计) 46%
3. Far (财报) 35%
4. Bec (商务) 48%

要想取得CPA的资质,以上四门考试的成绩都要超过75%的答对率。这次ChatGPT有一门连一半的分数都没达到,多少给我们美国注会留了点面子啦!
wh楼主
论坛元老
论坛元老
wh 的博客
帖子: 30815
注册时间: 7月 28, 2022, 12:07 am
昵称(选填): 问号

Re: ChatGPT这回考砸了

帖子 wh楼主 »

图片
pathdream
论坛支柱
论坛支柱
帖子: 12543
注册时间: 7月 25, 2022, 11:42 am
昵称(选填): 葱韭集团团长

Re: ChatGPT这回考砸了

帖子 pathdream »

3.5
生命中的一切,早已暗中标好了价格。(不同地方价格不一样,不同的人价格不一样,不同时候价格也有所不同。)自由不是免费的,自由也不是无价的,任何东西都不是免费的。
bodhidharma
职业作家
职业作家
帖子: 595
注册时间: 7月 27, 2022, 12:52 am

Re: ChatGPT这回考砸了

帖子 bodhidharma »

没有专门调试吧,有人怕了
wh楼主
论坛元老
论坛元老
wh 的博客
帖子: 30815
注册时间: 7月 28, 2022, 12:07 am
昵称(选填): 问号

Re: ChatGPT这回考砸了

帖子 wh楼主 »

pathdream 写了: 5月 9, 2023, 11:01 pm3.5
这个version是旧的还是新的?
xy18
见习作家
见习作家
帖子: 425
注册时间: 7月 23, 2022, 10:11 pm

Re: ChatGPT这回考砸了

帖子 xy18 »

3.5是旧的,比4差很多。
wh. 写了: 5月 9, 2023, 11:05 pm 这个version是旧的还是新的?
wh楼主
论坛元老
论坛元老
wh 的博客
帖子: 30815
注册时间: 7月 28, 2022, 12:07 am
昵称(选填): 问号

Re: ChatGPT这回考砸了

帖子 wh楼主 »

bodhidharma 写了: 5月 9, 2023, 11:02 pm 没有专门调试吧,有人怕了
需要调什么?之前考MBA和律师bar exam时是调过的吗?
wh楼主
论坛元老
论坛元老
wh 的博客
帖子: 30815
注册时间: 7月 28, 2022, 12:07 am
昵称(选填): 问号

Re: ChatGPT这回考砸了

帖子 wh楼主 »

xy18 写了: 5月 9, 2023, 11:07 pm 3.5是旧的,比4差很多。
哦,那应该用新的测的。
头像
hci
论坛精英
论坛精英
帖子: 6545
注册时间: 7月 22, 2022, 3:29 pm
昵称(选填): 海螺子

Re: ChatGPT这回考砸了

帖子 hci »

4比3.5强很多。

现在还有32 k token的版本,更强,这种问题应该可以弄的。
wh. 写了: 5月 9, 2023, 10:58 pm 转:这回ChatGPT栽了

ChatGPT自出道以来,所向披靡,可谓是“人挡杀人,佛挡杀佛”。它先后通过了宾大商学院 Wharton MBA考试,律师的 Bar Exam等考试。

据 “今日会计”(Accounting Today)报道, 4月13日,有好事者在纽约用了两台分别装有 ChatGPT 3.5 Pro account的笔记本电脑,各自参加了两门美国注册会计师CPA的考试。结果如何呢?

这是它们“哥俩”的成绩:
1. Reg (法规) 39%
2. Aud (审计) 46%
3. Far (财报) 35%
4. Bec (商务) 48%

要想取得CPA的资质,以上四门考试的成绩都要超过75%的答对率。这次ChatGPT有一门连一半的分数都没达到,多少给我们美国注会留了点面子啦!
zyy
见习写手
见习写手
帖子: 124
注册时间: 10月 10, 2022, 12:49 am
昵称(选填): zyy

Re: ChatGPT这回考砸了

帖子 zyy »

这难道不是手拿把攥迟早的事么?CPA能比MBA、律师高级多少
头像
hci
论坛精英
论坛精英
帖子: 6545
注册时间: 7月 22, 2022, 3:29 pm
昵称(选填): 海螺子

Re: ChatGPT这回考砸了

帖子 hci »

Prompt,也就是给它的题目的写法,很重要。题目写得好,它各种難題都可解。
wh. 写了: 5月 9, 2023, 11:07 pm 需要调什么?之前考MBA和律师bar exam时是调过的吗?
wh楼主
论坛元老
论坛元老
wh 的博客
帖子: 30815
注册时间: 7月 28, 2022, 12:07 am
昵称(选填): 问号

Re: ChatGPT这回考砸了

帖子 wh楼主 »

cae 写了: 5月 9, 2023, 11:19 pm 下次直接拿 往届真题答案训练
哈哈,应试训练,老中拿手!
wh楼主
论坛元老
论坛元老
wh 的博客
帖子: 30815
注册时间: 7月 28, 2022, 12:07 am
昵称(选填): 问号

Re: ChatGPT这回考砸了

帖子 wh楼主 »

hci 写了: 5月 10, 2023, 12:02 am 4比3.5强很多。

现在还有32 k token的版本,更强,这种问题应该可以弄的。
嗯。想想CPA应该不会比另两个考试难出天花板……
wh楼主
论坛元老
论坛元老
wh 的博客
帖子: 30815
注册时间: 7月 28, 2022, 12:07 am
昵称(选填): 问号

Re: ChatGPT这回考砸了

帖子 wh楼主 »

zyy 写了: 5月 10, 2023, 12:03 am 这难道不是手拿把攥迟早的事么?CPA能比MBA、律师高级多少
不知道电脑什么时候会全面取代会计师、律师、金融家……
wh楼主
论坛元老
论坛元老
wh 的博客
帖子: 30815
注册时间: 7月 28, 2022, 12:07 am
昵称(选填): 问号

Re: ChatGPT这回考砸了

帖子 wh楼主 »

hci 写了: 5月 10, 2023, 12:03 am Prompt,也就是给它的题目的写法,很重要。题目写得好,它各种難題都可解。
哦,上岗前需要一点职业训练。
头像
liufanghe
职业作家
职业作家
帖子: 760
注册时间: 9月 18, 2022, 10:37 pm

Re: ChatGPT这回考砸了

帖子 liufanghe »

以我和他聊天的经验,这还是取决于他能看到多少真实的资料
“Information is power. But like all power, there are those who want to keep it for themselves.” ― Aaron Swartz

在新水木看到的有哲理的回答
月收入 1 万是个什么样的水平?拿的人能接受,看的人说 “活不下去” 的水平。
可怜的美华。上半辈子折腾美国签证,下半辈子折腾中国签证。
wh楼主
论坛元老
论坛元老
wh 的博客
帖子: 30815
注册时间: 7月 28, 2022, 12:07 am
昵称(选填): 问号

Re: ChatGPT这回考砸了

帖子 wh楼主 »

liufanghe 写了: 5月 10, 2023, 2:06 am 以我和他聊天的经验,这还是取决于他能看到多少真实的资料
是。我们版上还贴过很多ChatGPT犯的文学常识错误,比如作家作品张冠李戴。记得看到过一个新闻说某人告了ChatGPT的公司,ChatGPT说他贩毒坐牢,而那人其实是wistleblower,也没坐过牢,看到ChatGPT这么介绍他时无比震惊愤怒。
头像
萧武达
论坛元老
论坛元老
帖子: 16429
注册时间: 12月 28, 2022, 10:39 pm
昵称(选填): shiaovd

Re: ChatGPT这回考砸了

帖子 萧武达 »

聊天来说,ChatGPT不如这个 https://huggingface.co/chat/
只是抢了先机, 比较一下,就知道谁更聪明
Dahuaidanyimei
知名作家
知名作家
帖子: 1140
注册时间: 3月 14, 2023, 4:18 pm
昵称(选填): Badegg

Re: ChatGPT这回考砸了

帖子 Dahuaidanyimei »

3.5用的是两年前的数据,不知道近两年的事情。这种需要更新法规的事情它怎么会懂
datada
著名点评
著名点评
帖子: 4483
注册时间: 7月 29, 2022, 3:23 pm
昵称(选填): datada

Re: ChatGPT这回考砸了

帖子 datada »

数字竞赛试过吗?AMC, AIMI 和 IMO的 题有人试过吗?
回复

回到 “精华区”