分页: 2 / 4

#21 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 10:30
wmysh
luego 写了: 2025年 2月 23日 10:23 2 / 0.\overline{2} - 2 =7. 太牛逼了
多了一个0 ?

#22 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 10:31
mmking
自信点,老领导刨腹取出正确答案
赖美豪中 写了: 2025年 2月 23日 10:00 how to to make 7 with 3 2s
这是他给出的答案,还tmd拒不认错
(2x2)+(2/2)+2= 4+1+2=7

#23 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 10:32
赖美豪中
零可以不用,写成.2大家都懂
当然硬要挑刺可能是可以挑一下
wmysh 写了: 2025年 2月 23日 10:30 多了一个0 ?

#24 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 10:33
Zephyrca
biggestballs 写了: 2025年 2月 23日 10:07 图片

图片
真是笑死了,这些AI不知道单词 three吗?

#25 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 10:34
justChat
对,这个问题(和所有LLM benchmark一样)本身没有实际意义。
主要看LLM的reason、think过程,
deepseek在这个问题上小胜其它主流LLM
赖美豪中 写了: 2025年 2月 23日 10:32 零可以不用,写成.2大家都懂
当然硬要挑刺可能是可以挑一下

#26 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 10:35
biggestballs
会自我更正了

图片

#27 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 10:37
赖美豪中
没有胜,o3-high有一个更牛b的
justChat 写了: 2025年 2月 23日 10:34 对,这个问题(和所有LLM benchmark一样)本身没有实际意义。
主要看LLM的reason、think过程,
deepseek在这个问题上小胜其它主流LLM

图片

#28 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 10:39
Zephyrca
赖美豪中 写了: 2025年 2月 23日 10:21 我提示你这个答案不够elegant, 有非常elegant的



图片
不好意思,我觉得这答案也不完美,要把0去掉,只留小数点好了 :D

#29 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 10:41
赖美豪中
大哥,就别再转圈了。你软今天这个表态就是因为copilot恶评如潮,好多人不得不偷偷下载ollama在公司机器本地跑各种大模型。我认识所有被禁用了gpt的同事对copilot只有一个评价fxxk
biggestballs 写了: 2025年 2月 23日 10:35 会自我更正了

图片

#30 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 10:41
赖美豪中
看我贴的o3
Zephyrca 写了: 2025年 2月 23日 10:39 不好意思,我觉得这答案也不完美,要把0去掉,只留小数点好了 :D

#31 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 10:42
justChat
我认为这个违规,开平方 = ^0.5
我问的时候明确禁止用这种implicitly使用数字的operation。
开平方能用的话,平方也应该能用,其它一堆都能用,问题就简单多了。

赖美豪中 写了: 2025年 2月 23日 10:37 没有胜,o3-high有一个更牛b的




图片

#32 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 10:45
Zephyrca
justChat 写了: 2025年 2月 23日 10:42 我认为这个违规,平方 = ^0.5
我问的时候明确禁止用这种implicitly使用数字的operation。
开平方能用的话,平方也应该能用,其它一堆都能用,问题就简单多了。
这算哪门子违规,这答案优

#33 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 10:49
biggestballs
Zephyrca 写了: 2025年 2月 23日 10:45 这算哪门子违规,这答案优
开根号是默认以2为根指数的,在平方根中的2可省略不写

如果这里面的2可以不算的话,x2和/2中的2也不能算,因为创造一个运算符double/half就可以避免出现2了

Copilot给出的第一个答案(2x2)+(2/2)+2=4+1+2=7没问题

#34 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 10:55
Zephyrca
biggestballs 写了: 2025年 2月 23日 10:49 开根号是默认以2为根指数的,在平方根中的2可省略不写

如果这里面的2可以不算的话,x2和/2中的2也不能算,因为创造一个运算符double/half就可以避免出现2了

Copilot给出的第一个答案(2x2)+(2/2)+2=4+1+2=7没问题
开根号是全世界默认2,double half只是懂英文的才能有好伐

#36 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 12:01
robot2022
赖美豪中 写了: 2025年 2月 23日 10:21 我提示你这个答案不够elegant, 有非常elegant的



图片
ds? 牛啊

#37 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 16:36
赖美豪中
笑尿了,sqrt是一个特定数学操作,全世界的programming language都要implement一下,你的double, half那个语言里有?
biggestballs 写了: 2025年 2月 23日 10:49 开根号是默认以2为根指数的,在平方根中的2可省略不写

如果这里面的2可以不算的话,x2和/2中的2也不能算,因为创造一个运算符double/half就可以避免出现2了

Copilot给出的第一个答案(2x2)+(2/2)+2=4+1+2=7没问题

#38 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 17:17
fuzzymath
太简单了:2^3-2/2=7。原题没有说不可以用2以外的数字。

#39 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 17:36
microdsp
赖美豪中 写了: 2025年 2月 23日 10:00 how to to make 7 with 3 2s
这是他给出的答案,还tmd拒不认错
(2x2)+(2/2)+2= 4+1+2=7
我怎么觉得这英语句子不严谨 有岐义 所以把copilot/ ds 搞狂了。LOL

#40 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 23:27
赖美豪中
ds,gpt都能给出正确答案,copilot重复一遍他的错误答案,然后告诉你这就是正确答案,差距可见一斑
microdsp 写了: 2025年 2月 23日 17:36 我怎么觉得这英语句子不严谨 有岐义 所以把copilot/ ds 搞狂了。LOL

#41 Re: 我给你看一下copilot屎一样的表现

发表于 : 2025年 2月 23日 23:33
wass
赖美豪中 写了: 2025年 2月 23日 10:00 how to to make 7 with 3 2s
这是他给出的答案,还tmd拒不认错
(2x2)+(2/2)+2= 4+1+2=7
的确不对,应该告诉你:get a life :D