私たちは、音声認識システムを完全に再構築し、ユーザーにより良い体験を提供できることをお知らせします。
この新機能はホステッドエクスペリエンスとSDK(NPMパッケージ)と共に利用できます。
🆕 このアップデートにより、以下の機能向上を期待できます 🆕
- 動音声検出機能により、デジタルヒューマンに話しかける際にプッシュ・トゥ・トークを使用する必要がなく、スペースキーを押すこともありません。
- 音声認識の精度が向上しました。遅延のある環境でも精度の低下はありません。
- マイク音声は、話し始めるまでデバイスから送信されないため、プライバシーが保護されています。
- マイクのミュート/アンミュートや、騒がしい環境ではプッシュ・トゥ・トーク機能をシミュレートするオプションがあります。
- 当社のボイスアクティビティ検出システムは、ノイズ(バックグラウンドノイズ、咳、音楽など)ではなく、音声の検出に特化してトレーニングされています。
- デジタルヒューマンの発話中に割り込むことができ、その際にはキャラクターは話すのを止めます。ただし、バックグラウンドノイズだけではキャラクターの発話を中断することはありません。
- 安定性が向上し、より信頼性の高いデジタルヒューマン体験が可能になりました。
このインプットUIの場合はエンハンスド・スピーチ・レコグニッションで動作しています。
ホステッドエクペリエンス
移行ガイド
ホスト体験では、全てのビュー(レイアウト)で音声認識モードをサポートしています:
- マイクをミュート/アンミュートするボタン。
- マイクステータス(ミュート、聞き取り中、アクティブスピーチ、拒否)の表示。
- ユーザーの発話を文字認識して表示するキャプション・字幕が画面に表示されます。
音声認識モードに切り替えるには、uneeqInteractionsOptions
の設定を使用して、voiceInputMode
を"SPEECH_RECOGNITION"
に設定します。