ChatGPTに音声録音機能「Record Mode」追加 音声の要約・変換が可能に

2025年6月19日、米OpenAIは、AIチャットサービス「ChatGPT」に音声録音機能「Record Mode」を追加したと発表した。
ProやEnterpriseなど一部ユーザーを対象に、音声のテキスト化と要約、さらに多様なアウトプットへの変換が可能となる。
ChatGPT、音声を記録・要約する新機能を提供開始
OpenAIは、AIチャットボット「ChatGPT」のmacOS向けデスクトップアプリに新機能「Record Mode」を実装した。2025年6月19日にX(旧Twitter)上で発表し、対象はChatGPT Pro、Enterprise、Eduの各プランのユーザーとなる。
Record Modeは、ユーザーの音声をリアルタイムで録音し、それをテキストに変換・要約して保存する機能だ。
会議や音声メモの録音後、変換されたテキストはChatGPTの「Canvas(キャンバス)」として履歴に追加され、そこからさらにメール文やコードなどの形式に再生成することもできる。
録音は最大2時間まで可能で、録音後は自動的に要約処理が始まる。利用にはマイクへのアクセス許可が必要で、UI下部の「Record」ボタンをクリックし、自然な会話を行うだけでテキスト化される仕組みだ。録音後に「Send」を押すとCanvasが表示され、ユーザーは出力を編集・再指示できる。
OpenAIは、英語での変換精度が最も高いとしつつ、他言語対応も強化中と説明している。
議事録・音声メモの自動化が進展 進む利便性と求められる慎重な設計
Record Modeは、既存の録音・文字起こしツールを代替しうる機能として注目される。
「Otter」などの外部サービスと同様の機能をChatGPT内で一貫して行える点は、ビジネスユーザーにとって大きな利便性となる。
要約や変換機能まで自動化されることで、議事録作成や振り返りの効率は飛躍的に向上する。特にCanvas形式での保存は、従来のチャット履歴と一線を画す整理性を持つ。
一方で、プライバシー面での懸念も残る。OpenAIは、録音音声はテキスト変換後すぐに削除され、モデル学習には使用しないと明言している。
ただし、ユーザー設定で「モデル改善への協力」を無効にしていない場合、要約文とキャンバスが学習に利用される可能性がある。
加えて、企業向けプランでは「Workplace Controls」から録音機能の有効・無効を管理できる仕組みが用意されており、業務への導入を見据えた柔軟な運用が可能だ。
音声入力から要約、活用までを一気通貫で支援するRecord Modeは、AIアシスタントの実用領域を広げる重要な一歩といえるだろう。