Sakana AIは自律型研究AI「The AI Scientist」に関する論文が英科学誌『Nature』に掲載されたと発表した。
AIがアイデア創出から実験、論文執筆までを自律的に担い、生成論文が査読を通過した事例として紹介された。
AIが研究生成から査読突破まで実証
Sakana AIが開発した「The AI Scientist」は、アイデア創出から実験、論文執筆までを一貫して実行する自律型エージェントである。
初期段階では簡易なコードテンプレートを基盤に研究生成を行い、論文としてまとめる一連のプロセスの自動化を実証していた。
その後、国際会議ICLRのワークショップにて、AI生成論文を未修正のまま投稿したところ、平均スコア6.33を獲得したという。
これは人間の論文の55%を上回る評価であり、採択基準を満たす水準に達したことを示す結果である。
なお、この取り組みはワークショップ主催者の許可を得て実施されており、採択後は規定に基づき、論文は取り下げられている。
2026年3月26日に同社が公表した『Nature』に掲載された論文では、これらの成果を統合しつつ、AIサイティストを支える高度な複数モデルがどのように組み合わされているかが明らかにされた。
具体的には、大まかな方向性を与えるだけで、自律的なアイデア創出、文献調査、エージェントによる探索(Agentic Tree Search)を用いた実験設計と実行が並列処理され、最終的にLaTeX形式で論文を生成できる。
さらに、視覚能力を持つモデルが図表検証までを完結させられるという。
加えて、論文評価を担う自動査読システム(※1)が構築されたことも発表された。
人間の査読データとの比較ではバランス精度69%を記録しており、F1スコア(※2)においては「NeurIPS 2021の一貫性実験」で測定された人間同士の合致率を上回る結果となった。
※1 自動査読システム:AIが論文の新規性や妥当性など複数の観点から評価し、採択可否を判断する仕組み。人間の査読者の負担軽減を目的とする。
※2 F1スコア:適合率(正しいと判断したものの正確さ)と再現率(見逃さず検出できた割合)の調和平均で算出される評価指標。分類や判定の精度を総合的に測るために用いられる。
研究加速の恩恵と信頼性リスク
AIによる研究自動化は、科学の生産性を飛躍的に高める可能性がある。
特に今回、基盤モデルの進化に伴い生成論文の質が向上する「スケーリング則(※3)」も確認されているため、将来的にAIが人間研究者の能力を補完、あるいは一部代替する展開が現実味を帯びてきたと言える。
一方で、現時点では独創性の不足や不正確な引用、図表の重複といった課題も残りそうだ。
これらは研究の信頼性を損なう要因となり得るほか、論文生成コストの低下は成果の水増しや査読負担の増大を招くリスクも孕む。
科学コミュニティ全体の評価基準が揺らぐ可能性も否定できない。
Sakana AIは倫理審査の実施やAI生成論文への透かし付与など透明性確保を進めているが、今後も同様の制度設計やガイドライン整備が不可欠となるだろう。
将来的には創薬や気候科学、宇宙探査など多領域への応用が期待されるが、その進展はAIの性能向上だけでなく、人間との役割分担をどう設計するかに大きく依存することになるだろう。
科学の加速と信頼性の両立が、次の競争軸になると言える。
※3 スケーリング則:AIモデルの規模や計算資源の増加に伴い性能が向上する傾向。
関連記事:
三菱電機がSakana AIに出資 製造・社会インフラの意思決定をAIで高度化へ

Sakana AIがNamazu公開 事後学習で日本仕様に適応、バイアス是正

Sakana AI、防衛イノベーション科学技術研究所の委託研究を開始 AIで観測・報告・統合を高速化
