Sakana AI、自己改善するAIエージェント「DGM」を発表 自身のコードを自律的に最適化

2025年5月30日、東京を拠点とするSakana AIは、自身のPythonコードを自動修正し性能を向上させるAIエージェント「ダーウィン・ゲーデル・マシン(DGM)」を発表した。
進化論に基づくアルゴリズムを応用し、コーディング能力を自ら成長させる仕組みだ。
コードを自律的に書き換える進化型AI「DGM」が公開
Sakana AIが発表したDGMは、従来のAIエージェントと異なり、自らの機能構成を見直して書き換え、性能を継続的に改善する特徴を持つ。
一般的なAIモデルは、事前学習が完了すれば固定された性能に留まるが、DGMは自律的に学習を継続することが特徴だという。
DGMはPythonで記述された自身のコードを読み取り、エージェントを構成するWeb検索ツールやワークフローを自動的に修正する。
さらに、変更後のコーディング性能を自ら評価し、次の改善に反映させるループを内包している。
性能評価では、バグ修正能力を測定するベンチマーク「SWE-bench」において、DGMは自動的に20.0%から50.0%へとスコアを向上。
また、多言語でのコーディング能力を測る「Polyglot」でも14.2%から30.7%へと改善を実現した。
人間が手動で設計した競合AIエージェント「Aider」の性能を上回る結果となった。
DGMは、AI研究者ユルゲン・シュミットフーバーが提唱した「ゲーデルマシン」に触発されて開発された。
数学者クルト・ゲーデルの理論を応用し、AIが自己改善を行うという発想を、ブリティッシュコロンビア大学のジェフ・クルーン教授の研究室との共同研究により実装した。
「自己改善型AI」の実用化に一歩、安全性と応用性に注目
DGMの特筆すべき点は、他の基盤モデルに対しても同様の改善手法が通用したことにある。
Anthropicの「Claude Sonnet 3.5」やOpenAIの「o3-mini」を使用しても、DGMは同等の性能向上を実現した。
これは、自己修正機構が特定のモデルに依存しない汎用性を持つことを示唆している。
一方で、AIが自律的にコードを書き換えるという性質は、安全性に対する懸念も伴う。
Sakana AIは、全ての自己修正と評価をサンドボックス環境(※)で行い、Webアクセスには厳格な制限を設けたうえで、人間の監督下に置いたと説明している。
また、DGMが行った全ての変更履歴は追跡可能な状態にあった。
それを考慮すると、実用化には安全性のハードルが依然として存在していると言わざるを得ない。
とはいえ、進化的アルゴリズムと形式論理に基づくこの新型AIは、研究者や開発者の補助を超え、自律的な成長という次なるステージへ踏み出そうとしている。
今後、実運用に向けたさらなる安全基準の策定と、開発現場での応用実験が注目される。
※サンドボックス環境:外部と隔離された安全な仮想実行空間。外部システムに影響を与えることなく、コードの動作を検証できる技術。