指南

EchoVCast 的設定和使用逐步指南。

1. 開始使用

1

下載並安裝

從網站下載並安裝 EchoVCast。

2

註冊

首次啟動時，在桌面應用程式中使用授權金鑰進行註冊。

3

下載語言包

選擇並下載您要使用的語言包。每個語言包約 3 GB。

2. 設定音訊

麥克風

在麥克風面板的裝置下拉選單中選擇您的麥克風。音訊電平表顯示輸入活動。

系統音訊

啟用系統音訊面板，透過 WASAPI 回環從任何應用程式（YouTube、Twitch、Discord 等）擷取音訊。可選擇直播模式和影片模式。

每個面板可以獨立啟動和停止。

3. 選擇語言

選擇語音語言（正在說的語言）。
選擇翻譯語言（要翻譯成的語言）。
支援：英語、日語和中文（繁體）。
每個面板都有獨立的語言設定。

4. 翻譯

在每個面板中開啟翻譯開關以啟用翻譯。
按下每個面板上的開始按鈕來開始。
原文顯示在上方文字方塊中，翻譯顯示在下方。
灰色文字顯示中間（處理中）辨識結果。

5. OBS 整合

文字來源

EchoVCast 寫入文字檔案（原文、翻譯、合併），您可以在 OBS 中將它們新增為「從檔案讀取」文字來源。

隱藏字幕

透過 WebSocket 連線到 OBS，將 CEA-608 隱藏字幕傳送到您的直播串流中。在設定中配置 OBS WebSocket 密碼。

輸出目錄和最大行數可在設定中配置。

6. 匯出轉錄記錄

點擊工具列中的匯出（儲存）按鈕。
可匯出為 TXT、SRT 或 VTT 字幕檔案。
匯出內容包含原文和翻譯文字的完整工作階段記錄。

7. 設定

模型分頁用於管理語言包以及切換 GPU/CPU 模式。一般分頁涵蓋 OBS 整合、快捷鍵、不當詞彙過濾器、文字大小等。語音分頁可針對每種語言和音訊來源調整語速、STT 優先級、VAD 靈敏度和波束大小。帳戶分頁顯示授權資訊。

8. 技巧

使用 GPU 模式以獲得最佳效能（需要 NVIDIA 顯示卡）。
為獲得最佳效果，請將語音辨識優先度設為「精度」，語速設為「快速」。
使用 EchoVCast 時請關閉其他 GPU 佔用較高的應用程式。
對於系統音訊，持續直播使用直播模式，較短內容使用影片模式。
使用不當詞彙過濾器保持直播內容的清潔。
釘選視窗以在直播時保持其始終在最前面。
最適合非高 GPU 負載或未運行圖形密集型遊戲的直播，因為這些可能會影響語音辨識效能。
使用直接麥克風輸入而非經過後處理或虛擬音訊裝置，以獲得最佳語音辨識準確度。