2026年4月28日、AIベンチャーのLifePromptは、最新の生成AI「ChatGPT 5.2 Thinking」と「Gemini 3 Pro Preview」が、東大・京大の入試問題で合格最高点を上回ったと発表した。国内大学入試においてAIが「首席合格」相当の成績を記録したのは初とみられる。
東大理三超え AIが満点連発
今回の検証では、東大・京大の2次試験前期日程を画像化しAIに入力、記述式を含む解答を大手予備校河合塾の講師が採点した。その結果、東大理科三類において、合格者最高点(453.60点)に対し、ChatGPTは503.59点、Geminiは496.54点を獲得し、いずれも合格最高点を上回った。
今年の試験問題において数学は満点、英語も9割に達するなど論理・読解系で突出した性能を示した。一方、世界史の論述は2.5割にとどまり、長文の文脈評価や史観の整理では課題が残る。
2024年には東大入試では、全科類不合格だった経緯を踏まえると、わずか2年での飛躍は推論能力の進化が実用域に入ったことを示唆する。
試験の意味再定義 評価軸は人間性へ
この結果は、知識再現や定型的推論を中心とする試験設計の限界を浮き彫りにした。
今後、企業の採用でも筆記試験の比重は低下し、課題設定力や協働、倫理判断といった非認知能力の比重が高まる可能性が考えられ、AIと共働する前提での「使いこなし力」が評価軸になる公算が大きい。
他方で、教育現場には二つのリスクがある。
第一に、AI前提の答案生成が進み、学習過程の可視化が難しくなる点。
第二に、評価の公平性が揺らぐ点である。
対策としては口頭試問やプロジェクト型評価の拡充、AI利用の明示ルール整備が現実解となるだろう。
AIの発展により浮き彫りとなった、従来教育の課題。
入試と採用は、知識の多寡から思考の質へと軸足を移しつつあると言える。