指南

EchoVCast 的設定和使用逐步指南。

1. 開始使用

1

下載並安裝

從網站下載並安裝 EchoVCast。

2

註冊

首次啟動時,在桌面應用程式中使用授權金鑰進行註冊。

3

下載語言包

選擇並下載您要使用的語言包。每個語言包約 3 GB。

2. 設定音訊

麥克風

在麥克風面板的裝置下拉選單中選擇您的麥克風。音訊電平表顯示輸入活動。

系統音訊

啟用系統音訊面板,透過 WASAPI 回環從任何應用程式(YouTube、Twitch、Discord 等)擷取音訊。可選擇直播模式和影片模式。

每個面板可以獨立啟動和停止。

3. 選擇語言

  • 選擇語音語言(正在說的語言)。
  • 選擇翻譯語言(要翻譯成的語言)。
  • 支援:英語、日語和中文(繁體)。
  • 每個面板都有獨立的語言設定。

4. 翻譯

  • 在每個面板中開啟翻譯開關以啟用翻譯。
  • 按下每個面板上的開始按鈕來開始。
  • 原文顯示在上方文字方塊中,翻譯顯示在下方。
  • 灰色文字顯示中間(處理中)辨識結果。

5. OBS 整合

文字來源

EchoVCast 寫入文字檔案(原文、翻譯、合併),您可以在 OBS 中將它們新增為「從檔案讀取」文字來源。

隱藏字幕

透過 WebSocket 連線到 OBS,將 CEA-608 隱藏字幕傳送到您的直播串流中。在設定中配置 OBS WebSocket 密碼。

輸出目錄和最大行數可在設定中配置。

6. 匯出轉錄記錄

  • 點擊工具列中的匯出(儲存)按鈕。
  • 可匯出為 TXT、SRT 或 VTT 字幕檔案。
  • 匯出內容包含原文和翻譯文字的完整工作階段記錄。

7. 設定

模型分頁用於管理語言包以及切換 GPU/CPU 模式。一般分頁涵蓋 OBS 整合、快捷鍵、不當詞彙過濾器、文字大小等。語音分頁可針對每種語言和音訊來源調整語速、STT 優先級、VAD 靈敏度和波束大小。帳戶分頁顯示授權資訊。

8. 技巧

  • 使用 GPU 模式以獲得最佳效能(需要 NVIDIA 顯示卡)。
  • 為獲得最佳效果,請將語音辨識優先度設為「精度」,語速設為「快速」。
  • 使用 EchoVCast 時請關閉其他 GPU 佔用較高的應用程式。
  • 對於系統音訊,持續直播使用直播模式,較短內容使用影片模式。
  • 使用不當詞彙過濾器保持直播內容的清潔。
  • 釘選視窗以在直播時保持其始終在最前面。
  • 最適合非高 GPU 負載或未運行圖形密集型遊戲的直播,因為這些可能會影響語音辨識效能。
  • 使用直接麥克風輸入而非經過後處理或虛擬音訊裝置,以獲得最佳語音辨識準確度。