MENU
採用担当の方はこちら
業務委託案件をお探しの方はこちら
メルマガ/AI・Web3 Insight



    Google、Webブラウザー操作特化AI「Gemini 2.5 Computer Use」を発表

    2025年10月7日(現地時間)、米Googleは最新AIモデル「Gemini 2.5 Pro」を活用し、Webブラウザー操作に特化したAIモデル「Gemini 2.5 Computer Use」を発表した。ユーザーの操作を模倣し、業務自動化の効率化を目指す新技術である。

    目次

    AIが画面操作まで実行、Web業務自動化に革新

    Gemini 2.5 Computer Useは、ユーザーのリクエストやスクリーンショット、直近の操作履歴を基に、クリック・入力・スクロールなどのUI操作を自律的に実行するAIである。
    従来のAIモデルが生成や推論に特化していたのに対し、GUI操作の柔軟性と正確性を追求しているのが特徴だ。

    モデルは初期タスクでスクリーンショットを取得し、それを入力として受け取り、出力されたアクションをブラウザー上で実行する。処理後は再びスクリーンショットを撮影し、AIにフィードバックするループを繰り返すことで作業を完了させる。
    重要操作ではユーザー確認が必須で、誤った支払いなどのリスクを防ぐ設計である。

    Googleによれば、UI操作精度を測定するベンチマーク「Online-Mind2Web」において、Gemini 2.5 Computer Useは低レイテンシを維持しつつ高精度を実現した。これにより、ワークフロー自動化やWebアプリのUIテスト効率化への活用が期待される。

    現在、同モデルはGemini API経由でパブリックプレビュー可能であり、Google AI StudioやVertex AIからのアクセスも可能だ。また、「Browserbase」でホストされたデモを通じ、実際の操作を体験できる。
    将来的にはモバイルアプリ操作にも対応が期待されるが、デスクトップOS操作は未対応である。

    Web操作AIが拓く業務効率化と新たなリスクの課題

    「Gemini 2.5 Computer Use」によって、Webブラウザー上の操作やUIテスト、データ収集などのルーティン業務をAIに任せることが可能となり、企業の作業効率は大幅に向上すると考えられる。
    繰り返し作業や複雑な入力処理も短時間で正確にこなせるため、人手不足の解消だけでなく、従来の業務プロセスの改善にも寄与するだろう。

    一方で、自律的に操作を行うAIを社内業務に導入する際は、誤操作や意図しない情報入力への注意が必要だ。
    特にフォーム送信やログイン情報の管理など、セキュリティリスクが潜む部分には監査体制の構築が不可欠だろう。

    また、Webサービス側のUI変更やサーバー応答の変化にAIが柔軟に対応できるかは、導入後の安定稼働に直結する課題となる。更新やメンテナンスに応じた学習や調整が求められる。

    今後、モデルの改良や適用範囲の拡大により、より複雑なWeb作業や業務プロセスへの対応が進むと予測される。企業のAI活用戦略において、Web操作AIは中心的な役割を果たす分野となるだろう。

    🚀 AI・Web3業界への転職を考えているあなたへ

    「最先端技術に関わる仕事がしたい」「成長市場でキャリアを築きたい」そんな想いを抱いていませんか?

    Plus Web3は、AI・Web3領域などテクノロジーに投資する企業の採用に特化したキャリア支援サービスです。

    運営する株式会社プロタゴニストは、上場企業グループの安定した経営基盤のもと
    10年以上のコンサルタント歴を持つ転職エージェントが
    急成長する先端技術分野への転職を専門的にサポートしています。

    こんな方におすすめです

    ▼成長産業であるAI・Web3業界で新しいキャリアを始めたい
    ▼「未経験だけど挑戦してみたい」という熱意がある
    ▼今のスキルを最先端技術分野でどう活かせるか相談したい
    ▼表に出ない優良企業の情報を知りたい

    業界に精通したキャリアアドバイザーが、
    あなたの経験・スキル・志向性を丁寧にヒアリングし、
    最適な企業とポジションをマッチングします。

    Web3企業

    AI企業

    この記事が気に入ったら
    フォローしてね!

    • URLをコピーしました!
    目次