🎙️
speech to text,
音声文字起こしツール
音声ファイルをブラウザ内でAIローカル処理しテキスト化。
サーバーに送信されないため機密情報も安全です。
🔒
ローカルAI
音声は端末の外に出ません
🌐
日本語・英語対応
Whisperモデル搭載
⏱️
タイムスタンプ
発話位置と文字を対応
🤖
AIモデルの読み込みが必要です
このツールはブラウザ内でローカルに音声認識を実行するため、初回のみ約40MB〜70MBのAIモデル(Whisper)をダウンロードします。通信量が発生するため、Wi-Fi環境でのご利用をおすすめします。サーバへのデータ送信は一切行われません。
📁
音声ドロップ
MP3, M4A, WebM (~100MB)
🎤
マイク入力を開始
クリックして話す
🖥️
システム音のみ録音
⚠️「音声も共有」に✔必須
🎧
WEB会議 (マイク+相手)
⚠️「音声も共有」に✔必須
📝 文字起こし結果
about,
概要
ブラウザ内で動作するAI(Whisperモデル)を利用し、音声をローカル環境で直接文字起こしする画期的なツールです。音声データをサーバーに一切送信しないため、機密性の高い会議の録音や個人的なボイスメモでも安全にご利用いただけます。
how to,
使い方
1
音声のドロップ
対象の動画や音声をドラッグします。
2
自動解析
AIモデル(Whisper)がブラウザ内で文脈を判断しながら高精度に文字を起こします。
glossary,
用語集
- 音声認識 (Speech Recognition)
- マイクから入力された音声をリアルタイムでテキストに変換する技術。本ツールではブラウザの Web Speech API を利用して実現しています。
- Web Speech API
- ブラウザに標準搭載された音声認識・音声合成のためのAPI。Google ChromeやEdgeで高精度な音声認識が利用可能です。
- リアルタイム文字起こし
- 発話と同時に音声がテキストに変換されていく処理方式。会議の議事録作成やインタビューの記録に活用されます。
- 音声入力言語
- 音声認識エンジンが解析対象とする言語設定。日本語・英語・中国語など多数の言語に対応しています。
- 中間結果 (Interim Results)
- 発話中にリアルタイムで表示される暫定的な認識テキスト。発話が完了すると最終的な認識結果に置き換わります。
- 音声区間検出 (VAD)
- 音声信号の中から人の発話区間を自動的に検出する技術。無音部分を省略して効率的に文字起こしを行います。
- クリップボード
- テキストや画像を一時的に保存するOS標準の機能。認識されたテキストをワンクリックでコピーし、他のアプリに貼り付けることができます。
faq,
FAQ
- Q.録音した音声データはサーバーに送信されますか?
- 音声認識処理自体はブラウザが内蔵するWeb Speech APIを経由するため、音声データがGoogleやMicrosoftの認識サーバーに送られる場合があります。ただし本ツール自体がデータを保存・収集することは一切ありません。
- Q.どのブラウザで使用できますか?
- Google Chrome、Microsoft Edgeで最も安定して動作します。Safari やFirefoxでは Web Speech API の対応が限定的なため、一部機能が制限される場合があります。
- Q.日本語以外の言語でも文字起こしできますか?
- はい。英語、中国語、韓国語、スペイン語など多数の言語に対応しています。言語選択メニューから切り替えてお使いください。
- Q.長時間の録音でも大丈夫ですか?
- ブラウザの仕様上、一定時間で音声認識セッションが自動的に切断されることがあります。本ツールは自動再接続機能を備えていますが、数時間を超える長時間利用ではページの再読み込みをおすすめします。
- Q.認識精度を上げるにはどうすればよいですか?
- 静かな環境で、マイクに近い位置からはっきりと発話すると精度が向上します。外付けマイクの使用も効果的です。
- Q.文字起こし結果をファイルとして保存できますか?
- はい。認識されたテキストをコピーボタンでクリップボードにコピーし、メモ帳やWordに貼り付けて保存できます。
- Q.スマートフォンでも使えますか?
- Android の Chrome ブラウザでは対応しています。iOS Safari では Web Speech API の対応が限定的なため、認識精度や機能に制限がある場合があります。
use cases,
活用シーン
📝
会議の議事録
ローカル処理のため、機密情報が含まれた社内会議のデータも安全に文字起こしできます。