メインコンテンツへスキップ
最新ニュース 3分で読める

IBMとDeepgramが連携、企業AIに高度音声機能を統合 音声エージェント時代が加速

PlusWeb3 編集部
PlusWeb3 編集部 Web3・AI専門メディア

現地時間2026年2月24日、米IBMと音声AI企業Deepgramは、音声認識・音声合成機能をIBMの生成AI基盤に統合する協業を発表した。エンタープライズAIにおける音声インターフェースの高度化と業務自動化の拡大が見込まれる。

IBMの生成AIに音声機能を統合

今回の協業により、Deepgramの音声認識(STT)および音声合成(TTS)技術が、IBMの業務自動化ソリューション「watsonx Orchestrate(※)」に組み込まれる。
DeepgramはIBM初の音声パートナーとなり、企業が自然言語による音声操作でデジタルエージェントを活用できる環境を提供する。

Deepgramは音声AIに専門性を持つAI企業であり、IBMによると、これまでに「5万年以上に相当する音声データを処理し、1兆語以上を文字起こししてきた実績を持つ」という。

音声処理の知見が深いDeepgramとの機能統合により、リアルタイム文字起こしや字幕生成、低遅延の音声対話、カスタムチューニングなどがより精緻になることが期待される。
背景雑音や多様なアクセントといった実環境での利用を想定し、アラビア語の方言やインド地域の複数言語など幅広い言語・方言への対応も明言された。

これにより、医療や金融をはじめとした分野で、通話分析や音声主導のデータ入力、自動顧客対応といった業務の高度化が期待される。音声をAIエージェントの主要なインターフェースとする動きが、企業領域でも本格化しつつあると言える。

※watsonx Orchestrate:IBMが提供する業務自動化向け生成AI基盤。AIエージェントを活用し、業務プロセスの自動化やワークフロー管理を行う企業向けソリューション。

音声AIが業務自動化の次の基盤に

今回の連携は、エンタープライズAIの焦点がテキスト中心からマルチモーダルへ移行している流れを示すものだと言える。音声インターフェースが実用レベルに達すれば、キーボード操作を伴わない業務遂行が可能となり、現場作業やモバイル環境での生産性向上につながる可能性がある。

特にコールセンターやフィールド業務では、リアルタイム分析と自動記録により業務負荷の軽減と品質の標準化が期待できる。

一方で、音声データは個人情報や機密情報を多く含むため、セキュリティやデータガバナンスへの対応が不可欠だ。
また、多言語対応やアクセント最適化が進むことでグローバル展開の障壁は下がるが、各国の規制や運用コストの最適化も課題となるだろう。

IBMにとってはオープンなAIエコシステム強化の一手であり、Deepgramにとっても大規模企業市場へのアクセス拡大につながる戦略的提携と位置付けられる。音声エージェントが企業システムの標準機能となるかが、今後の競争軸になりそうだ。

IBMプレスリリース

関連記事:

IBM、Anthropicと戦略的提携 企業向けAI開発環境に「Claude」統合へ

RELATED ARTICLEIBM、Anthropicと戦略的提携 企業向けAI開発環境に「Claude」統合へ2025年10月7日、米IBMとAIスタートアップAnthropicが企業向けA…Read
IBMとDeepgramが連携、企業AIに高度音声機能を統合 音声エージェント時代が加速
Share this article コピーしました
WRITTEN BY

PlusWeb3 編集部

Web3・AI専門メディア

PlusWeb3 編集部は、ブロックチェーン・Web3・AIの最新動向をわかりやすくお届けする専門メディアチームです。業界経験豊富な編集者とリサーチャーが、信頼性の高い情報を厳選してお届けします。

記事を寄稿しませんか?

Web3・AI領域の専門家からの寄稿を募集中。掲載は編集部名義、内容は事前審査のうえ掲載可否をご連絡します。

この記事が役に立ったら、ニュースレターも登録しませんか?

Web3・AI業界の厳選ニュースを定期配信。いつでも解除可能。

スパムは送りません。プライバシーポリシーに基づいて管理します。

コピーしました

Web3・AI・DeepTech領域でのキャリアをお考えですか?

業界専門のコンサルタントが、あなたに最適なキャリアパスをご提案します。