韓国政府、国産AIモデルに向け大規模データ募集 GPU・人材含め支援へ

2025年6月23日、韓国科学技術情報通信省は、独自の大規模AIモデル構築に向け、テキストや画像などのデータ提供機関を公募すると発表した。
公共・民間の高品質データを集約し、国家主導でのファウンデーションモデル開発に本格着手する。
韓国政府、国産AI開発に向けデータ提供機関を公募開始
韓国科学技術情報通信省は、AIファウンデーションモデル(※)の構築に必要な学習用データを確保するため、官民のデータ提供機関を対象に公募を開始した。
募集期間は2025年7月21日までで、政府主導による国家戦略プロジェクトとして展開される。
この公募は、2026年から本格化する韓国型AIモデルの支援事業に先駆けた準備段階にあたる。
開発チームに対してはGPU、人材、データといった資源が包括的に提供される。
公募対象となるデータはテキスト、音声、画像など多様な形式を想定しており、著作権など法的権利が明確に確保されたものに限られる。
事業管理には、韓国情報通信産業振興院(NIPA)、韓国知能情報社会振興院(NIA)、韓国データ産業振興院(K-Data)が参画。
データ提供は、専用ストレージを備えたAIハブを通じた共有、または直接提供の形式で実施される予定である。
無償提供機関にはOCR処理や重複排除、法的審査などの基本支援と実費補償が提供され、有償提供は非商用利用を前提に適正価格が協議される。
商用転用の際は別途協議が求められる。
※ファウンデーションモデル:大規模なテキストや画像などのデータを基に事前学習されたAIモデル。生成AIや多用途AIの基盤として利用される。
民間と公共の連携拡大へ 高品質データ確保が鍵握る国策AI
今回の公募制度は、韓国が独自にAIファウンデーションモデルを持つことを目指す国家戦略の核となる。
GPU・人材・データといった開発資源を包括的に提供する体制には、官民の研究開発スピードを加速させる効果が期待できるだろう。
現時点で学習用データの提供機関を広く公募している点も、データの多様性と量を確保するうえで有効と考えられる。
一方で、収集されたデータの質が均質である保証はなく、仮に偏りやノイズを多く含む場合には、モデル精度の劣化につながる可能性がある。
とくに日本語や中国語のような周辺言語との競争で優位に立つには、単なる「量」ではなく言語的・文化的な「精度」と「網羅性」が問われる。
データの精査を行う優れたプロセスの確立が急務となるだろう。
2026年から本格化する「韓国型AIモデル」の開発は、今後数年間にわたり東アジアにおけるAI覇権争いの一角を占める競争を激化させる見込みだ。
とくに、米中の大規模モデルが席巻する中で、第三極としての技術的存在感を確立できるかが鍵となる。