韓国スタートアップ、革新的なAI音声合成技術を披露 音声を識別する技術や視覚障がい者支援技術も

2025年3月3日から6日までスペイン・バルセロナで開催されたモバイルワールドコングレス(MWC ※)において、韓国の新興企業3社が革新的なAI音声合成・認識技術を発表した。視覚障がい者支援アプリから感情表現可能な音声合成、指輪型音声認識デバイスまで、次世代の音声技術が注目を集めている。
視覚障がい者支援や自然な抑揚の音声など、音声特化のAI技術
今回のMWCで存在感を示したのは、視覚障がい者向けアプリを開発するTUAT社だ。今回展示された「SULLIVAN PLUS」は、文字認識や色彩識別、顔認識、紙幣識別などの機能を持ち、視覚情報を音声で伝える技術を実用化した。TUAT社は2025年8月にスマートグラスの発売を予定しており、このアプリを使用した視覚障がい者の行動範囲拡大と生活の質向上が期待される。
ほかの韓国企業も、音声に関する目を引くプロダクトを発表した。Hudson AI社は、感情をリアルに表現するAI音声合成技術を展示した。自然な抑揚を持つ音声生成が可能で、スポーツ実況の自動翻訳や多言語吹き替えサービスへの応用を進める方針だという。Hudsonm社によれば、2025年3月から北米のスポーツチャンネルで野球中継の実況翻訳が開始される予定であり、現在9言語に対応し、年後半にはリアルタイム対応を目指すとのことだ。
また、VTouch社は特定の人物の音声のみを識別するAI音声認識技術「WIZPR RING」を発表した。指輪型デバイスを装着することで、運転中やスマートフォンを操作できない状況でも装着者の音声コマンドを認識し、遠隔操作が可能になる。同技術は韓国語、英語を含む20カ国語に対応しており、音声インターフェースの新たな可能性を示すものと言える。
※モバイルワールドコングレス(MWC):世界最大のモバイル産業展示会で、最新のスマートフォンや通信技術が発表される国際的なイベント。
多様なAI音声技術の未来
これらの技術開発の背景には、音声インターフェースがスマートフォンの次の主要な操作方法になるという業界の見通しがある。特に視覚障がい者支援は社会的意義が高く、情報へのアクセシビリティを向上させる可能性を秘めている。
Hudson AIの音声合成技術は、感情や自然な抑揚を再現するうえで重要だ。現在検討されているスポーツ実況や、共感を伴う会話など、感情を伝えることが必要な場面では、重要性が増すだろう。
一方、VTouchの「WIZPR RING」は日常生活における音声操作の利便性向上に寄与するものと考えられる。指輪型という小型かつ非侵襲的なデバイスは、常時装着が可能であり、公共の場での使用にも適している。
韓国発のAI音声技術は、単なる技術革新にとどまらず、社会的課題の解決や新たなサービス創出の可能性を示すものである。MWCという国際舞台での発表は、韓国のスタートアップ企業が世界市場を視野に入れた展開を目指していることの表れと言えよう。