Kotoba Technologies、生成AI同時翻訳を開発 予測型AI翻訳で遅延マイナス0.5秒

日本のスタートアップ「Kotoba Technologies」が提供する生成AI同時通訳サービスが話題となっている。2025年6月1日の報道によると、平均遅延は1秒未満、さらに「マイナス0.5秒」という予測通訳を実現しており、AI翻訳が予測段階に突入した象徴的な例とされる。
生成AIが実現する話す前から翻訳が始まる同時通訳
Kotoba TechnologiesのCEO・小島熙之氏が手がける同時通訳サービスは、従来の「話し終えてから翻訳する」方式を一新した。独自に開発した生成AIモデルを活用し、話者が話し始めた瞬間、またはそれ以前に翻訳を開始できる仕組みだ。
通常の翻訳アプリは、人が発話を終えてから解析を始めるため、一定の遅延が避けられなかった。しかし、小島氏の技術は発話の予測を組み込み、「マイナス0.5秒」という、話す前に翻訳が表示される速度を実現している。これは、AIが話者の次の言葉を予測し、翻訳テキストを先読みすることによる。
同サービスは日本語、英語、中国語、韓国語に対応し、平均遅延は1秒以内で安定運用されている。予測による誤訳もあるが、リアルタイムで訂正されるため、利便性とスピードの両立を果たしている点が評価される。
背景には、世界的にAI開発競争が激化する中、米中の大手企業が多方面にリソースを割く一方で、Kotoba Technologiesは音声・同時翻訳に特化し、スピードを極限まで追求した戦略がある。
生成AI同時翻訳のメリット・課題と今後の展望
生成AIによる同時翻訳は、言語の壁を大幅に縮める可能性を秘めている。
ビジネス現場では、即時かつ高精度な通訳が可能になることで国際会議や商談の効率が飛躍的に向上するだろう。特に、リアルタイム性の高さはコミュニケーションの遅延を解消し、意思決定のスピードアップにも寄与する。
また、多言語対応が進むことでグローバル展開の障壁が減り、中小企業やスタートアップにも恩恵が及ぶ可能性がある。言語学習の必要性を問う声も上がるが、文化的・感情的な交流においては、言語の習得は今後も価値を持ち続けると小島氏は指摘している。
一方、予測型AI特有の誤訳リスクは依然として課題だ。誤った先読み翻訳がユーザーに混乱を招く可能性があり、誤訳訂正の精度向上やセキュリティ対策も求められる。
さらに、データプライバシーや情報漏洩のリスクに対して、業界特化の安全なプラットフォーム構築が急務である。
将来的には、音声から音声への翻訳やメガネ型端末での視覚的なリアルタイム翻訳など、より自然なコミュニケーション形態への進化が期待できる。日本発の技術が世界市場でどこまでシェアを伸ばせるかが、今後の注目点といえるだろう。