機能
EchoVCastの機能と、何ができるかをご紹介します。
ローカル音声認識
音声認識はお使いのマシン上でローカルに実行されます。NVIDIA GPUを使用すると最速ですが、CPUモードも利用可能です(遅延は大きくなります)。精度は状況により異なります。クリアな音声で話者が1人の場合が最も良好です。背景ノイズ、強いアクセント、早口で重なる発話ではエラーが増えます。音声がコンピュータの外に送信されることはありません。
- GPUアクセラレーションまたはCPUフォールバック
- 各言語専用のエンジン
- 無音区間をフィルタリングする音声アクティビティ検出
機械翻訳
文字起こしされたテキストはサーバーに送信され、機械翻訳されます。英語、日本語、中国語(繁体字)間の双方向翻訳に対応しています。日常会話の翻訳は概ね良好ですが、慣用句、文化的な表現、曖昧な文脈では精度が落ちることがあります。
- 直近の文脈を活用してより自然な翻訳を実現
- 双方向の言語ペア
- 明瞭な会話調の発話で最も良好に動作
OBS連携
EchoVCastはOBS互換のテキストファイルに書き出し、WebSocket経由でクローズドキャプションを送信できます。OBS側での設定が必要です。詳しくはガイドページをご覧ください。
- OBSテキストソースファイル出力
- WebSocketクローズドキャプション(CEA-608)
- マイクとシステム音声の個別チャンネル
デュアル音声キャプチャ
マイクとシステム音声を同時にキャプチャして処理できます。ライブ配信、動画、音声通話の翻訳と同時に自分の声もキャプチャしたい場合に便利です。両ソースはそれぞれ独立した言語設定で動作します。
- マイクとシステム音声の同時キャプチャ
- システム音声キャプチャ用WASAPIループバック
- ソースごとに独立した言語設定
その他の機能
セッション記録
セッション全体のログをTXT、SRT、VTT字幕ファイルとしてエクスポートできます。
グローバルホットキー
他のアプリを使用中でもキーボードショートカットで翻訳を操作できます。
不適切表現フィルター
配信をクリーンに保つための、オプションの単語ベースフィルターです。
内蔵アップデーター
アプリ内から直接、更新の確認と新しいバージョンのインストールができます。
Windows ネイティブ
Windows 10/11専用。NVIDIA GPU推奨、CPUフォールバックも利用可能。