OpenAI、画像生成機能をAPIで提供開始 ”ジブリ風”で話題を集めた画像生成を外部と連携

現地時間2025年4月23日、OpenAIはChatGPTの人気機能である画像生成機能をAPIとして外部開発者や企業に向けて公開した。
APIとしてのリリースにより、話題を呼んだジブリ風画像の生成が外部ツールでも可能となる。
「gpt-image-1」の実力と拡張性
OpenAIが新たにAPIとして提供を開始した「gpt-image-1」は、ChatGPTの画像生成機能を支えるモデルである。
テキストや画像などの複数の種類の情報を処理できる「マルチモーダル」なモデルで、文章を解釈して画像を生成したり、画像の情報をテキストにすることが可能だ。
3月25日にChatGPTの有料ユーザー向けに先行公開された画像生成機能は、わずか1週間で1億3000万人以上のユーザーが利用し、7億枚以上の画像を生み出すという驚異的な反響を得た。
特に「ジブリ風」と形容される温かみのある作風の画像生成に注目が集まり、SNSを中心にブームが巻き起こった。
ChatGPTの画像生成機能の精度と柔軟性はすでに業界大手も認めており、AdobeやFigma、Canvaといったデザイン関連企業だけでなく、QuoraやInstacartなど多分野のプラットフォームに導入されている。
開発者や企業は、このAPIを自社のサービスに統合することで、ユーザーがAIによるビジュアル生成を直感的に利用できる環境を整えられるようになる。
料金体系はトークン制で、画像の品質によって単価が変動する。
低品質画像では約2セント、中品質で約7セント、高品質では最大約19セントとされており、用途や目的に応じて柔軟に選択できる設計となっている。
安全面でも対策は強化されており、有害な画像生成を未然に防ぐ仕組みに加え、生成画像にはC2PAメタデータ(※)が自動で埋め込まれるため、出所や生成履歴の透明性が確保されている。
また、APIの利用にあたっては、OpenAIの開発者コンソールを通じてAPIの組織認証を行う必要がある場合がある。
これは、商用利用や大規模導入を行う上で信頼性を担保するための措置と見られている。
※C2PAメタデータ:
Coalition for Content Provenance and Authenticity(C2PA)による規格で、デジタルコンテンツの出所や改変履歴をメタデータとして埋め込み、透明性と信頼性を担保する技術。
技術的制約と今後の展望
「gpt-image-1」には、現時点で課題がいくつか確認されている。
複雑な指示文(プロンプト)に対しては生成処理に2分近くかかるケースがあり、リアルタイム性が求められる場面では運用に工夫が求められる。
また、生成されたテキストの視認性に難があることや、キャラクターやブランド要素の一貫性を複数回の生成にわたって保つのが困難であるといった技術的な限界もある。
とはいえ、今回のAPI公開により既存サービスとの連携が進めば、UXの強化やコンテンツ生成コストの削減といった恩恵を得ることができるだろう。
一方で、生成物のクオリティや倫理的ガイドラインの整備はますます重要になるだろう。
今後、視覚的一貫性やレイアウト精度の向上が進めば、生成AIは広告・出版・教育といった分野でも主力技術として定着していく可能性が高いと思われる。