作者una283 (无)
看板SENIORHIGH
标题[新闻] GPT-5.2 日本学测类考试夺冠AI 学力逼近
时间Wed Jan 21 23:09:44 2026
GPT-5.2 日本学测类考试夺冠
AI 学力逼近顶尖考生
January 20, 2026 by TechNews 编辑台
在 1 月 17 日至 18 日举行的日本大学入学共通测试
中,OpenAI 的最新人工智慧模型 GPT-5.2 表现出
色,成功在 9 个科目中获得满分,整体得分率达到
97%。这个成绩不仅超越了 Google 的 Gemini 3
Flash(得分率约 91%),还显示出 AI 在学术能力上
的显着提升,可能超越人类考生的潜力。
此次测试的实验由AI新创公司Life Prompt与日本
经济新闻共同进行,涵盖多个科目。测试过程中,
问题透过光学字元辨识(OCR)技术从PDF转换为
Markdown格式,并结合了图像输入。根据报告,
GPT-5.2在公共与伦理科目中获得满分,并在地理
科目中也表现优异,得分超过80%。然而,该模型
在某些科目中出现超时的问题,显示出其在处理复
杂问题时的局限性。
与此同时,Google的Gemini 3 Flash在公共与伦
理科目中同样获得满分,但整体得分率约为91%,
不及GPT-5.2。Claude Sonnet 4.5模型的表现也
不容小觑,虽然在公共与伦理科目中得分为97分,
但整体得分却显示出与其他模型的差异。
在实际的共通测试中,约有30万5,104名考生参
加了新设的资讯科目,并且因不当行为而有7名考
生被取消资格。这次测试的平均分数将於1月21日
公布。
这个系列的结果不仅突显了AI在教育领域的潜力,
也引发了对於未来大学入学考试形式的深思。AI的
进步可能会改变教育的历史,并引发对於考试公平
性和有效性的讨论。
https://technews.tw/2026/01/20/openai-gpt-5-2-japan-test/
————-
看看人家,这才是正常的测试啊~
「透过光学字元辨识(OCR)技术从PDF转换为
Markdown格式,并结合了图像输入」
上篇台湾补习班业者的新闻推文就有网友提醒
PDF的图文格式AI不好判读
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.132.181.237 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/SENIORHIGH/M.1769008186.A.030.html
1F:推 lovehan: 有一个新考科,情报。 01/21 23:56
2F:→ una283: 他们的考科还真多 01/22 05:50
4F:→ una283: 测试原文,一共七考科AI计算过程共需一小时上下 01/22 06:08
5F:→ una283: 但是Claude Opus 4.5竟然只要6分8秒 01/22 06:12
6F:→ una283: 算超级快,成绩也不错。 01/22 06:15
7F:→ una283: 得意科目: 化学(93%)、生物(92%)、地学(89%) 01/22 06:15
8F:→ una283: 苦手科目: 数学I・A(67%)、数学II・B・C(69%) 01/22 06:15
9F:→ una283: 总体评价第一名的跟前面学测pdf档测试相反 01/22 06:17
10F:→ una283: GPT-5.2(1位: 662点/700点 = 94.6%) 01/22 06:17
11F:→ una283: 得意科目: 生物(100%)、数学I・A(100%)、 01/22 06:18
12F:→ una283: 数学II・B・C(98%)、化学(97%) 01/22 06:18
13F:→ una283: 苦手科目: 物理(86%) 01/22 06:18
14F:→ una283: 而Gemini 3 Pro和Gemini 3 Flash分居二、三位 01/22 06:20
15F:→ una283: 得分629、627点/700点,但Flash在算数A遇到 01/22 06:26
16F:→ una283: 挑战(グループ问题)得分只有72% 01/22 06:27
17F:→ una283: 也就是说Flash在其他科表现更好 01/22 06:29