在 1 月 17 日至 18 日舉行的日本大學入學共通測試中,OpenAI 的最新人工智慧模型 GPT-5.2 表現出色,成功在 9 個科目中獲得滿分,整體得分率達到 97%。這個成績不僅超越了 Google 的 Gemini 3 Flash(得分率約 91%),還顯示出 AI 在學術能力上的顯著提升,可能超越人類考生的潛力。
此次測試的實驗由AI新創公司Life Prompt與日本經濟新聞共同進行,涵蓋多個科目。測試過程中,問題透過光學字元辨識(OCR)技術從PDF轉換為Markdown格式,並結合了圖像輸入。根據報告,GPT-5.2在公共與倫理科目中獲得滿分,並在地理科目中也表現優異,得分超過80%。然而,該模型在某些科目中出現超時的問題,顯示出其在處理複雜問題時的局限性。
與此同時,Google的Gemini 3 Flash在公共與倫理科目中同樣獲得滿分,但整體得分率約為91%,不及GPT-5.2。Claude Sonnet 4.5模型的表現也不容小覷,雖然在公共與倫理科目中得分為97分,但整體得分卻顯示出與其他模型的差異。
在實際的共通測試中,約有30萬5,104名考生參加了新設的資訊科目,並且因不當行為而有7名考生被取消資格。這次測試的平均分數將於1月21日公布。
這個系列的結果不僅突顯了AI在教育領域的潛力,也引發了對於未來大學入學考試形式的深思。AI的進步可能會改變教育的歷史,並引發對於考試公平性和有效性的討論。
(首圖來源:Unsplash)






