兩年內從落榜躍升榜首！ChatGPT日頂大超越真人

2026/04/29

日本人工智慧新創公司LifePrompt近日公布一項測試結果，使用OpenAI最新生成式模型參與東京大學與京都大學入學考試後，總成績不僅達到錄取標準，部分科系甚至超過真人考生最高分，引發外界對AI能力與教育制度的討論。

此次測驗採用OpenAI推出的「ChatGPT-5.2 Thinking」模型。研究團隊將考題轉換為影像格式後交由AI作答，申論題則由補教機構河合塾教師依照正式評分標準批改，再與共通測驗成績合併計算。

在東大考試部分，總分550分中，AI在人文組取得452分，理組則拿下503分，均高於校方公布的錄取最高成績。其中競爭最激烈的理科三類，AI比實際榜首還高出約50分，表現尤其受到矚目。

京都大學方面，AI在法學相關考試中獲得771分，也超越真人最高分734分；醫學相關科系則取得1176分，同樣高於考生最佳成績。

各科表現中，數學進步幅度最受關注。據分析，去年AI解答東大理科數學時仍明顯失分，如今已能在高難度試題中取得滿分。英語成績也達高分水準。不過，在世界史等需長篇分析與脈絡論述的題型上，AI仍相對吃力，得分偏低。

研究團隊指出，目前大型語言模型在計算、知識整理與推理能力上已有顯著提升，但涉及觀點建構、歷史脈絡分析與文章組織時，仍與人類存在差距。

值得注意的是，LifePrompt過去也曾多次以AI挑戰日本頂尖大學考題。2024年時，當時版本的ChatGPT尚未達到錄取門檻；隔年更新模型後才首次通過標準。如今短短兩年間，AI已從未錄取進步到取得榜首級成績，顯示生成式人工智慧的發展速度遠超外界預期。

對於這項結果，日本學界也開始討論未來教育方向。有專家認為，當AI在知識型與解題型考試逐漸展現優勢後，傳統升學制度可能需要重新思考評量重點，更加重視創造力、批判思考與問題定義能力等人類較具優勢的面向。【記者鄒弘整理報導】

搜尋表單