Googleが新たな画像生成AI「Whisk」を一般ユーザー向けに試験運用

2025-02-14

2025年2月12日、Googleが日本を含む100か国以上で「Whisk」の試験運用を開始した。従来のテキスト中心の生成方法ではなく、画像をプロンプトとして扱う発想が特徴的であり、非デザイナーでも自在にビジュアルを創作できる点が注目されている。

直感的な画像生成を可能にする背景とGeminiの役割

Whiskが目指すのは、AI技術をより多くの人々の手に届けることだ。
テキストを考え込まなくても、ドラッグ＆ドロップによってモデルやシーン、さらにはスタイルを組み合わせられる仕組みは、これまで画像生成AIに触れたことのない層を取り込む可能性が高い。
Whiskの背後にあるGemini（※）によって、入力された画像の特徴を抽出して詳細なキャプションを生成する。続いてImagen 3がそのキャプションをもとに新しいビジュアルを生み出すため、単なるコピーではなく、特徴を再編して独自の表現を生成できる設計になっているのだ。

こうした工程を介することで、ユーザーは予想外の創作物に出会うことがあり、想定と違う出来上がりになった場合にもプロンプトを編集して微調整する手段が用意されている。非デザイナーでも直観的に試行錯誤しやすいため、広告や商品プロモーションなどの現場ではプロトタイピングの効率化につながると見られる。また、画像に直接働きかける方法は言語による制約が少なく、幅広い国や地域で一斉に導入する上でも利点が大きいと考えられる。

教育現場に広がる応用と今後への期待

Whiskは教育の領域でも多くの活用策が見込まれている。
たとえば、教師が視覚的教材を自作する際には、既存の画像を複数組み合わせて新しい題材を素早く生み出せるため、授業内容に沿った効果的な資料を容易に用意できる。
アートやデザイン科目では、学生が自らWhiskを操作しながらビジュアルを生成するプロセスに取り組むことで、想像力を高める学習体験が期待される。
インタラクティブな授業の場面では、画面を共有しながら生徒たちと一緒にアイデアを具体化し、その場で得られた作品に対して即座にフィードバックを与えることが可能になる。言葉で思考を表すのが苦手な学生にとっても、画像をベースに考えを可視化しやすい仕組みが大きな助けとなるはずだ。
将来的には、こうしたクリエイティブツールの普及が学習者のモチベーションを高めることで、芸術分野だけでなく幅広い教科での活用につながっていくのではないだろうか。

Googleは今後の機能拡張や安全策の強化を進めるとみられている。ユーザーからの声を取り入れることで、Whiskの利便性はますます向上する見通しである。

※Gemini：Googleの大規模AIモデルの名称であり、テキストや画像などを総合的に解析してキャプションを生成する役割を担う。キャプション情報をImagen 3に渡すことで、直感的な画像合成を実現している。

🚀 AI・Web3業界への転職を考えているあなたへ

「最先端技術に関わる仕事がしたい」「成長市場でキャリアを築きたい」そんな想いを抱いていませんか？

Plus Web3は、AI・Web3領域などテクノロジーに投資する企業の採用に特化したキャリア支援サービスです。

運営する株式会社プロタゴニストは、上場企業グループの安定した経営基盤のもと
10年以上のコンサルタント歴を持つ転職エージェントが
急成長する先端技術分野への転職を専門的にサポートしています。

こんな方におすすめです

▼成長産業であるAI・Web3業界で新しいキャリアを始めたい
▼「未経験だけど挑戦してみたい」という熱意がある
▼今のスキルを最先端技術分野でどう活かせるか相談したい
▼表に出ない優良企業の情報を知りたい

業界に精通したキャリアアドバイザーが、
あなたの経験・スキル・志向性を丁寧にヒアリングし、
最適な企業とポジションをマッチングします。

キャリア相談する