现在的AI还是有non trivial的东西

版主: hci

头像
cover
著名点评
著名点评
帖子互动: 133
帖子: 3541
注册时间: 2023年 5月 9日 09:53

#21 Re: 现在的AI还是有non trivial的东西

帖子 cover »

Caravel 写了: 2025年 7月 2日 22:52 你连SAT都吹,什么水平可想而知
SAT的语文都考不好,还LLM理解,就是笑话

标签/Tags:
shanghaibaba(没有)
论坛元老
论坛元老
帖子互动: 799
帖子: 14493
注册时间: 2022年 7月 31日 18:08

#22 Re: 现在的AI还是有non trivial的东西

帖子 shanghaibaba(没有) »

Caravel 写了: 2025年 7月 2日 22:46 扯鸡巴蛋,AIME2025年都快90分了。满分一百,SAT那些初中生题目还能搞不定?

sat 阅读理解跟aime还是完全不同的吧,aime是真考数学,sat考阅读理解
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 554
帖子: 24432
注册时间: 2022年 7月 24日 17:21

#23 Re: 现在的AI还是有non trivial的东西

帖子 Caravel楼主 »

shanghaibaba 写了: 2025年 7月 2日 22:56 sat 阅读理解跟aime还是完全不同的吧,aime是真考数学,sat考阅读理解
现在的LLM做题都是从读题目开始啊,和人一样,中国高考语文也考了,SAT不可能搞不定
shanghaibaba(没有)
论坛元老
论坛元老
帖子互动: 799
帖子: 14493
注册时间: 2022年 7月 31日 18:08

#24 Re: 现在的AI还是有non trivial的东西

帖子 shanghaibaba(没有) »

Caravel 写了: 2025年 7月 2日 22:58 现在的LLM做题都是从读题目开始啊,和人一样,中国高考语文也考了,SAT不可能搞不定
不好说,中国高考知识性强一点,这个是ai的强项
AI不知道啥时候能做GRE阅读
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 554
帖子: 24432
注册时间: 2022年 7月 24日 17:21

#25 Re: 现在的AI还是有non trivial的东西

帖子 Caravel楼主 »

shanghaibaba 写了: 2025年 7月 2日 22:59 不好说,中国高考知识性强一点,这个是ai的强项
AI不知道啥时候能做GRE阅读
现在AI阅读能力已经很强了,不信你可以试试

高考语文的阅读更绕
shanghaibaba(没有)
论坛元老
论坛元老
帖子互动: 799
帖子: 14493
注册时间: 2022年 7月 31日 18:08

#26 Re: 现在的AI还是有non trivial的东西

帖子 shanghaibaba(没有) »

Caravel 写了: 2025年 7月 2日 23:00 现在AI阅读能力已经很强了,不信你可以试试

高考语文的阅读更绕
经常错,不能信。我经常拿它来读论文。能减轻一点负担,但是基本都要重新自己读一遍把关。很多错的
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 554
帖子: 24432
注册时间: 2022年 7月 24日 17:21

#27 Re: 现在的AI还是有non trivial的东西

帖子 Caravel楼主 »

shanghaibaba 写了: 2025年 7月 2日 23:03 经常错,不能信。我经常拿它来读论文。能减轻一点负担,但是基本都要重新自己读一遍把关。很多错的
SAT这种结构化的不会有什么问题
头像
cover
著名点评
著名点评
帖子互动: 133
帖子: 3541
注册时间: 2023年 5月 9日 09:53

#28 Re: 现在的AI还是有non trivial的东西

帖子 cover »

Caravel 写了: 2025年 7月 2日 22:58 现在的LLM做题都是从读题目开始啊,和人一样,中国高考语文也考了,SAT不可能搞不定
中国高考语文几分?
头像
cover
著名点评
著名点评
帖子互动: 133
帖子: 3541
注册时间: 2023年 5月 9日 09:53

#29 Re: 现在的AI还是有non trivial的东西

帖子 cover »

中國高考前夕,「貼題」市場再度掀起熱潮,從傳統名師高價貼題卷到AI生成的「預測密卷」層出不窮 。這些AI「貼題」試卷售價不菲,一份可高達人民幣300到400元 ,相較於一般幾十元的模擬試卷,價格飆升數倍,顯示出其高利潤空間。商家宣稱的「高命中率」是主要賣點,例如「精準貼中200分以上」、「相似度87.5%」、「貼到200到270分值」 。

家長焦慮助推市場需求
這種誇大宣傳精準抓住了家長和考生的求勝心態。受訪家長坦言,正是因為「看到網上宣傳得神乎其神,說某些名師貼題很準,心裡還是有點動搖,給孩子買了一套」 ,這直接反映了市場對此類產品的真實需求和家長在巨大壓力下的焦慮心理。

然而,多方權威報道,包括央視網的調查,揭露了這些所謂的「貼中」標準極其寬泛,實際僅基於題型和考點方向的「相似度」,而具體題目內容則大相徑庭 。舉例而言,一道數學幾何題,真題為五面體,貼題卷為三棱錐,題幹、設問均不相同,僅因均考查了「二面角的大小」這同一個知識點,就被商家大言不慚地判定為「貼中」 。

「貼中」定義之誇大與模糊
這種判定標準顯然與大眾對「貼中」的日常認知相去甚遠。江西省遂川中學教師袁媛明確指出,此類貼題卷的「命中」多依賴於廣泛的知識點覆蓋,而這些內容在學生日常的常規復習中本就已涵蓋,因此盲目追捧並不可取 。有高三學生郭軒瑋在使用過AI貼題卷後,也直言感覺AI貼題「都是比較通用的模板,根據往年高考題型制定的,而缺少了個性化的一些題目」 。

AI高考測試結果揭示真相

AI「貼題」的技術基礎主要依賴於大型語言模型(LLM)的自然語言處理(NLP)能力和大數據分析。LLM通過海量文本數據訓練,能夠深入理解人類語言的細微之處,並進行高效的資料轉換,例如自動評分、知識圖譜構建等 。然而,高考命題具有高度的「原創性」和「反貼題」原則,命題專家每年都會在題型穩定中求變,並調整具體參數和切入角度 。這使得AI即使能分析歷史數據,也難以精準預測具體的新考題。

AI技術與高考命題的矛盾

上海人工智能實驗室對7個主流AI大模型進行的高考語數外全卷測試結果顯示,儘管AI在語文和英語科目表現尚可,但數學成績普遍不及格,最高分也僅為75分(滿分420分) 。這一數據直接且有力地反駁了AI在應試能力上能「貼題」的商業宣傳。

AI(特別是大型語言模型)的強項在於大數據分析和內容生成,能夠基於歷史數據識別模式 。商家利用這一點,宣稱AI能「預測」考題。然而,高考命題的「原創性」和「反貼題」機制 意味著考題設計會刻意規避可預測性。因此,AI即使能分析海量舊題,也難以精準命中新題。商家將AI的「知識點覆蓋」能力誇大為「題目預測」能力,這是一種典型的技術錯位應用,將AI的輔助功能包裝成決定性工具,從而牟取暴利。

高考巨大的競爭壓力也導致家長和學生普遍存在高度焦慮。當這種焦慮達到頂點時,任何看似能提供「捷徑」或「優勢」的產品,即使價格高昂、效果存疑,也會被視為「救命稻草」 。商家精準地捕捉到這種心理,將AI的「高科技光環」與「貼題」的誘惑結合,形成了一條成熟的利益鏈 。這不僅是產品銷售,更是對社會普遍焦慮的資本化,反映了在極端競爭環境下,理性判斷易被情緒所左右的社會現象。

头像
cover
著名点评
著名点评
帖子互动: 133
帖子: 3541
注册时间: 2023年 5月 9日 09:53

#30 Re: 现在的AI还是有non trivial的东西

帖子 cover »

为啥中国上海测得AI高考数学不及格?
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 554
帖子: 24432
注册时间: 2022年 7月 24日 17:21

#31 Re: 现在的AI还是有non trivial的东西

帖子 Caravel楼主 »

cover 写了: 2025年 7月 2日 23:06 中国高考语文几分?
最高的128分,
https://www.stcn.com/article/detail/2271170.html
shanghaibaba(没有)
论坛元老
论坛元老
帖子互动: 799
帖子: 14493
注册时间: 2022年 7月 31日 18:08

#32 Re: 现在的AI还是有non trivial的东西

帖子 shanghaibaba(没有) »

cover 写了: 2025年 7月 2日 23:10 为啥中国上海测得AI高考数学不及格?
新题,没见过。随便编个求导给ai做做ai都不保证对
头像
cover
著名点评
著名点评
帖子互动: 133
帖子: 3541
注册时间: 2023年 5月 9日 09:53

#33 Re: 现在的AI还是有non trivial的东西

帖子 cover »

Caravel 写了: 2025年 7月 2日 23:11 最高的128分,
https://www.stcn.com/article/detail/2271170.html
这是自己测得。不是第三方测的

王婆卖瓜,自卖自夸

为啥上海测的数学不及格
上次由 cover 在 2025年 7月 2日 23:13 修改。
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 554
帖子: 24432
注册时间: 2022年 7月 24日 17:21

#34 Re: 现在的AI还是有non trivial的东西

帖子 Caravel楼主 »

cover 写了: 2025年 7月 2日 23:10 为啥中国上海测得AI高考数学不及格?
先看看哪一年的新闻
头像
cover
著名点评
著名点评
帖子互动: 133
帖子: 3541
注册时间: 2023年 5月 9日 09:53

#35 Re: 现在的AI还是有non trivial的东西

帖子 cover »

Caravel 写了: 2025年 7月 2日 23:13 先看看哪一年的新闻
今年的
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 554
帖子: 24432
注册时间: 2022年 7月 24日 17:21

#36 Re: 现在的AI还是有non trivial的东西

帖子 Caravel楼主 »

cover 写了: 2025年 7月 2日 23:13 这是自己测得。不是第三方测的

王婆卖瓜,自卖自夸

为啥上海测的数学不及格
字节跳动是非常专业的团队
头像
cover
著名点评
著名点评
帖子互动: 133
帖子: 3541
注册时间: 2023年 5月 9日 09:53

#37 Re: 现在的AI还是有non trivial的东西

帖子 cover »

Caravel 写了: 2025年 7月 2日 23:14 字节跳动是非常专业的团队
没用

大家热衷让AI做考试题,就证明我说的现在的AI,就是刷题AI

不是刷题AI,为啥热衷做考试题,难道AI用处是考试?
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 554
帖子: 24432
注册时间: 2022年 7月 24日 17:21

#38 Re: 现在的AI还是有non trivial的东西

帖子 Caravel楼主 »

cover 写了: 2025年 7月 2日 23:14今年的
这东西需要专业大厂发布,自媒体根本搞不懂,瞎写一起

你好歹贴一个正规的简体新闻

据我所知 有好几家做过测试

数学都是接近满分

我跟你看的是信誉比较高的
上次由 Caravel 在 2025年 7月 2日 23:21 修改。
头像
cover
著名点评
著名点评
帖子互动: 133
帖子: 3541
注册时间: 2023年 5月 9日 09:53

#39 Re: 现在的AI还是有non trivial的东西

帖子 cover »

Caravel 写了: 2025年 7月 2日 23:17 这东西需要专业大厂发布,自媒体根本搞不懂,瞎写一起
各大厂让AI做这么多考试干嘛?

难道是为了替代考生,让AI代考?

因为是刷题AI,考试最擅长,所以各个大厂热衷让AI考试
上次由 cover 在 2025年 7月 2日 23:22 修改。
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 554
帖子: 24432
注册时间: 2022年 7月 24日 17:21

#40 Re: 现在的AI还是有non trivial的东西

帖子 Caravel楼主 »

cover 写了: 2025年 7月 2日 23:18 各大厂让AI做这么多考试干嘛?

难道是为了替代考啥,让AI代考?

因为是刷题AI,考试最擅长,所以各个大厂热衷让AI考试
你贴的绝不可能是今年的新闻,不信你找个出处
回复

回到 “葵花宝典(Programming)”