digtools
🎙️
speech to text,

本地 AI 語音轉文字

使用本地 AI 完全在您的瀏覽器中轉錄音檔。100% 隱私保護。不需要上傳任何資料。

🔒
本地 AI
音檔資料不離開您的裝置
🌐
多國語言
由 Whisper AI 驅動
⏱️
時間戳記
輕鬆追蹤何時說了什麼
🤖

需要下載 AI 模型

為了在您的瀏覽器中本地執行語音辨識,本工具需要在第一次執行時下載一個約 40-70MB 的 AI 模型 (Whisper)。我們建議使用 Wi-Fi 連線。任何音檔資料都絕對不會上傳到任何伺服器。

about,

關於本工具

一個基於瀏覽器的工具,直接在您的瀏覽器內部執行 OpenAI 的 Whisper 模型。因為處理過程 100% 在本地進行,所以能保證絕對的隱私。強烈推薦用於商業會議、諮商訪談紀錄與私人語音備忘錄。

how to,

使用方法

1

拖放音檔

選擇您的音檔或影片檔。

2

本地分析

Whisper AI 模型會在您的瀏覽器中本地將語音轉換為文字。

glossary,

名詞解釋

語音辨識 (Speech Recognition)
將音訊輸入即時轉換為文字的技術。本工具透過 Transformers.js 使用 Whisper AI 模型,完全在您的瀏覽器中執行。
Whisper
OpenAI 的開源自動語音辨識 (ASR) 模型。支援數十種語言並提供極高的準確度,尤其是在英文、中文與日文方面。
Transformers.js
由 Hugging Face 開發的 JavaScript 函式庫,允許使用 WebAssembly 直接在瀏覽器中執行基於 Transformer 的 AI 模型 (如 Whisper),完全不需要伺服器。
時間戳記 (Timestamps)
轉錄文字中的時間標記,表示每段語音發生的時間點。對於瀏覽錄音與製作會議記錄非常有用。
中間結果 (Interim Results)
說話時即時顯示的臨時辨識文字。當一句話說完後,會被最終的辨識結果取代。
語音活動偵測 (VAD)
自動偵測音訊訊號中人類說話片段的技術。透過跳過無聲段落,能讓轉錄更有效率。
剪貼簿 (Clipboard)
作業系統層級的暫存區,用於暫時儲存文字或圖片。使用「複製」按鈕將辨識出的文字複製到剪貼簿,然後貼上到任何其他應用程式中。
faq,

常見問題

Q.我錄製的音檔會傳送到伺服器嗎?
不會。Whisper AI 透過 WebAssembly 完全在您的瀏覽器中執行。您的音檔資料絕不會離開您的裝置。本工具不會儲存或收集您的任何資料。
Q.支援哪些瀏覽器?
建議使用 Google Chrome 與 Microsoft Edge。Firefox 與 Safari 對 WebAssembly 多執行緒的支援有限,可能會影響模型的載入效能。
Q.我可以轉錄中文以外的語言嗎?
可以。Whisper 支援包含英文、中文、日文、韓文與西班牙文等數十種語言。只要從語言選單中選擇您的語言即可。
Q.為什麼第一次載入很慢?
Whisper 模型檔案 (大小約 40–70MB) 會在第一次使用時從 CDN 下載。之後,它們會被瀏覽器快取,後續的載入幾乎是瞬間完成。
Q.如何提高辨識準確度?
請在安靜的環境中靠近麥克風清晰地說話,如果可能的話,請使用外接麥克風。選擇正確的語言也能顯著改善結果。
Q.我可以將轉錄結果儲存為檔案嗎?
可以。使用「儲存」按鈕可將轉錄結果儲存為 .txt 檔,或使用「複製」按鈕將其複製到剪貼簿,然後貼到任何其他應用程式中。
Q.我可以在智慧型手機上使用嗎?
支援 Android 上的 Chrome。iOS Safari 對 WebAssembly 多執行緒的支援有限,這可能會限制模型的載入與轉錄效能。
use cases,

使用場景

📝

機密會議

安全地在本地轉錄私密的商業會議,完全不會將任何內容傳送到伺服器。

Send Feedback

Please let us know your thoughts to help us improve the tool.

免責聲明

本網站提供的所有工具均可免費使用,但請用戶自行承擔使用風險。本網站對各種工具的計算結果、轉換結果及生成數據的準確性、完整性和安全性不作任何保證。因使用本工具而產生的任何損害或糾紛,運營者概不負責,敬請見諒。此外,檔案處理與計算等操作原則上均在您的瀏覽器內完成,您輸入的數據不會傳送或保存在本網站的伺服器上。