Googleが新たな画像生成AI「Whisk」を一般ユーザー向けに試験運用

2025年2月12日、Googleが日本を含む100か国以上で「Whisk」の試験運用を開始した。従来のテキスト中心の生成方法ではなく、画像をプロンプトとして扱う発想が特徴的であり、非デザイナーでも自在にビジュアルを創作できる点が注目されている。
直感的な画像生成を可能にする背景とGeminiの役割
Whiskが目指すのは、AI技術をより多くの人々の手に届けることだ。
テキストを考え込まなくても、ドラッグ&ドロップによってモデルやシーン、さらにはスタイルを組み合わせられる仕組みは、これまで画像生成AIに触れたことのない層を取り込む可能性が高い。
Whiskの背後にあるGemini(※)によって、入力された画像の特徴を抽出して詳細なキャプションを生成する。続いてImagen 3がそのキャプションをもとに新しいビジュアルを生み出すため、単なるコピーではなく、特徴を再編して独自の表現を生成できる設計になっているのだ。
こうした工程を介することで、ユーザーは予想外の創作物に出会うことがあり、想定と違う出来上がりになった場合にもプロンプトを編集して微調整する手段が用意されている。非デザイナーでも直観的に試行錯誤しやすいため、広告や商品プロモーションなどの現場ではプロトタイピングの効率化につながると見られる。また、画像に直接働きかける方法は言語による制約が少なく、幅広い国や地域で一斉に導入する上でも利点が大きいと考えられる。
教育現場に広がる応用と今後への期待
Whiskは教育の領域でも多くの活用策が見込まれている。
たとえば、教師が視覚的教材を自作する際には、既存の画像を複数組み合わせて新しい題材を素早く生み出せるため、授業内容に沿った効果的な資料を容易に用意できる。
アートやデザイン科目では、学生が自らWhiskを操作しながらビジュアルを生成するプロセスに取り組むことで、想像力を高める学習体験が期待される。
インタラクティブな授業の場面では、画面を共有しながら生徒たちと一緒にアイデアを具体化し、その場で得られた作品に対して即座にフィードバックを与えることが可能になる。言葉で思考を表すのが苦手な学生にとっても、画像をベースに考えを可視化しやすい仕組みが大きな助けとなるはずだ。
将来的には、こうしたクリエイティブツールの普及が学習者のモチベーションを高めることで、芸術分野だけでなく幅広い教科での活用につながっていくのではないだろうか。
Googleは今後の機能拡張や安全策の強化を進めるとみられている。ユーザーからの声を取り入れることで、Whiskの利便性はますます向上する見通しである。
※Gemini:Googleの大規模AIモデルの名称であり、テキストや画像などを総合的に解析してキャプションを生成する役割を担う。キャプション情報をImagen 3に渡すことで、直感的な画像合成を実現している。
関連記事

Plus Web3は「Web3領域に特化したキャリア支援サービス」

Plus Web3では、Web3で働きたい人材と、個人に合わせた優良企業をマッチングする求人サービスを行っています。
- Web3で働くことも考えている…
- Web3のインターン先はどこがいいか分からない…
- どんな知識やスキルがあれば良いのか分からない…
このような悩みを抱える人は、一度「無料キャリア相談」にお越しください。あなたにマッチした優良企業をご紹介いたします。