兩年內從落榜躍升榜首!ChatGPT日頂大超越真人

日本人工智慧新創公司LifePrompt近日公布一項測試結果,使用OpenAI最新生成式模型參與東京大學與京都大學入學考試後,總成績不僅達到錄取標準,部分科系甚至超過真人考生最高分,引發外界對AI能力與教育制度的討論。

此次測驗採用OpenAI推出的「ChatGPT-5.2 Thinking」模型。研究團隊將考題轉換為影像格式後交由AI作答,申論題則由補教機構河合塾教師依照正式評分標準批改,再與共通測驗成績合併計算。

在東大考試部分,總分550分中,AI在人文組取得452分,理組則拿下503分,均高於校方公布的錄取最高成績。其中競爭最激烈的理科三類,AI比實際榜首還高出約50分,表現尤其受到矚目。

京都大學方面,AI在法學相關考試中獲得771分,也超越真人最高分734分;醫學相關科系則取得1176分,同樣高於考生最佳成績。

各科表現中,數學進步幅度最受關注。據分析,去年AI解答東大理科數學時仍明顯失分,如今已能在高難度試題中取得滿分。英語成績也達高分水準。不過,在世界史等需長篇分析與脈絡論述的題型上,AI仍相對吃力,得分偏低。

研究團隊指出,目前大型語言模型在計算、知識整理與推理能力上已有顯著提升,但涉及觀點建構、歷史脈絡分析與文章組織時,仍與人類存在差距。

值得注意的是,LifePrompt過去也曾多次以AI挑戰日本頂尖大學考題。2024年時,當時版本的ChatGPT尚未達到錄取門檻;隔年更新模型後才首次通過標準。如今短短兩年間,AI已從未錄取進步到取得榜首級成績,顯示生成式人工智慧的發展速度遠超外界預期。

對於這項結果,日本學界也開始討論未來教育方向。有專家認為,當AI在知識型與解題型考試逐漸展現優勢後,傳統升學制度可能需要重新思考評量重點,更加重視創造力、批判思考與問題定義能力等人類較具優勢的面向。【記者  鄒弘整理報導】