指南
EchoVCast 的設定和使用逐步指南。
1. 開始使用
1
下載並安裝
從網站下載並安裝 EchoVCast。
2
註冊
首次啟動時,在桌面應用程式中使用授權金鑰進行註冊。
3
下載語言包
選擇並下載您要使用的語言包。每個語言包約 3 GB。
2. 設定音訊
麥克風
在麥克風面板的裝置下拉選單中選擇您的麥克風。音訊電平表顯示輸入活動。
系統音訊
啟用系統音訊面板,透過 WASAPI 回環從任何應用程式(YouTube、Twitch、Discord 等)擷取音訊。可選擇直播模式和影片模式。
每個面板可以獨立啟動和停止。
3. 選擇語言
- 選擇語音語言(正在說的語言)。
- 選擇翻譯語言(要翻譯成的語言)。
- 支援:英語、日語和中文(繁體)。
- 每個面板都有獨立的語言設定。
4. 翻譯
- 在每個面板中開啟翻譯開關以啟用翻譯。
- 按下每個面板上的開始按鈕來開始。
- 原文顯示在上方文字方塊中,翻譯顯示在下方。
- 灰色文字顯示中間(處理中)辨識結果。
5. OBS 整合
文字來源
EchoVCast 寫入文字檔案(原文、翻譯、合併),您可以在 OBS 中將它們新增為「從檔案讀取」文字來源。
隱藏字幕
透過 WebSocket 連線到 OBS,將 CEA-608 隱藏字幕傳送到您的直播串流中。在設定中配置 OBS WebSocket 密碼。
輸出目錄和最大行數可在設定中配置。
6. 匯出轉錄記錄
- 點擊工具列中的匯出(儲存)按鈕。
- 可匯出為 TXT、SRT 或 VTT 字幕檔案。
- 匯出內容包含原文和翻譯文字的完整工作階段記錄。
7. 設定
模型分頁用於管理語言包以及切換 GPU/CPU 模式。一般分頁涵蓋 OBS 整合、快捷鍵、不當詞彙過濾器、文字大小等。語音分頁可針對每種語言和音訊來源調整語速、STT 優先級、VAD 靈敏度和波束大小。帳戶分頁顯示授權資訊。
8. 技巧
- 使用 GPU 模式以獲得最佳效能(需要 NVIDIA 顯示卡)。
- 為獲得最佳效果,請將語音辨識優先度設為「精度」,語速設為「快速」。
- 使用 EchoVCast 時請關閉其他 GPU 佔用較高的應用程式。
- 對於系統音訊,持續直播使用直播模式,較短內容使用影片模式。
- 使用不當詞彙過濾器保持直播內容的清潔。
- 釘選視窗以在直播時保持其始終在最前面。
- 最適合非高 GPU 負載或未運行圖形密集型遊戲的直播,因為這些可能會影響語音辨識效能。
- 使用直接麥克風輸入而非經過後處理或虛擬音訊裝置,以獲得最佳語音辨識準確度。