ChatGPTの画像生成で四コマ漫画を作ってみた!③ ChatGPTの画像制作は記事作成に応用できるか

3月25日、ChatGPTの画像生成機能が大幅にアップグレードされたことが話題を集めた。
新しい画像生成機能では、「GPT-4o」をモデルとして採用しており、これまでの「DALL-E 3」よりも長時間の推論を行うことで、細部にわたって破綻のない画像生成が可能になったという。
また、生成した画像を加工する機能も充実しており、対話しながらある要素を追加、削除、置換したり、また範囲を選択して編集することも可能だという。
この記事では、新しい画像生成機能で、コンテンツ制作に使える4コマ漫画が作ることができるかどうか、検証していく。
さっそく簡単な4コマ漫画を生成してみる
まずはアップデートされた画像生成機能がどんなものかを知るために、簡単な命令で4コマ漫画を生成させた。プロンプト(命令)は、「面白い4コマ漫画を作って」というシンプルなものだ。しばらく待機すると、以下のような漫画が出力された。
面白いかどうかは賛否が分かれるところだろうが、ちゃんとオチがあるアメリカンな絵柄の4コマ漫画を出力してくれた。描写に関しても、他のAI画像生成とは違った質感があり、クオリティについては確認できた。
コンテンツ制作向けの漫画を作成してみる
そこで、次はより実用的に、コンテンツ制作に使える漫画を生成できるか試してみることにした。プロンプトもより細かいものにして、クオリティの高い漫画を生成できるかを試験する。
想定するシチュエーションは、冒頭に挿入する分かりやすい4コマ漫画を作成する、というものだ。「記事のアイデアが出ないときはどうするか」というタイトルの記事で、SCAMPER法という手法を説明する記事を想定する。
入力したプロンプトは以下の通りだ。
「 『記事のアイデアが出ないときはどうするか』というタイトルで、SCAMPER法を説明する記事に添付する4コマ漫画の作成を依頼されました。わかりやすい4コマ漫画を作成してください。 4コマ漫画を作成する際は、以下の点に留意してください。
・セリフは日本語で出力する
・記事のアイデア出しに困っている人が、SCAMPER法を提案されるという筋書きにしてください
・4コマ漫画を読んだ読者が、SCAMPER法に興味を持つような展開にしてください。」
展開に関してかなり細かい注文も付けたプロンプトだが、適応できるだろうか。実際に出力された画像が、以下のものだ。
プロンプトの要求通りの展開の漫画が出力されたし、イラストのタッチも良くて使いやすそうだ。ただ、以下のような不自然な点もあった。
1. 番号の振り方
2. 3コマめの吹き出しの不自然さ
3. 「試」「浮」という漢字の不自然さ
もともと画像生成AIは文字の出力があまり得意ではないが、やはり今回のアップデートも日本語はそれほど得意ではないようだ。
試行錯誤をしたが、どうも文字の不自然さはぬぐえなかったので、割り切って吹き出しの中の文字列を削除することにした。画像の吹き出しの部分を選択して、空白にするよう指示を加えた。
すると、吹き出しの中身が空になった画像が、無事出力された。文字を使う場合、このようにその部分を空にして、Canvaなど他のツールで文字を打ち込んだほうが確実だろう。
ChatGPTの新しい画像編集を試した結果、十分なクオリティの画像を出力できることが確認できた。編集する範囲を指定する機能もあり、事後の加工もしやすく大変便利であると感じた。
一方で、やはり日本語の問題はどうしても存在する。この部分のクオリティを高めたければ自分で文字を打ち込むしかなく、その点が課題として残っているといえよう。