文字化け復元・エンコーディング変換ツール
文字化け(Mojibake)を瞬時に解読・修復する
ブラウザ完結型のテキストコンバータ。
復元するテキスト
文字化け復元ツールとは
本ツールは、文字化け(Mojibake)したテキストを貼り付けるだけで自動的に元のテキストに復元する無料オンラインツールです。UTF-8 / Shift_JIS / EUC-JP / ISO-2022-JP 間のすべての変換パターンを一括で自動判定し、最も自然な結果をご提示します。
すべての処理はブラウザ内のJavaScriptで完結し、入力された機密データは外部のサーバーに一切送信されません。会員登録やログインといった煩わしい手続きも一切不要で、プライバシーを保ったまま安心してご利用いただけます。
復元方法
テキストを入力
文字化けした文字列を入力エリアに貼り付けます。文字エンコーディングが破損したファイル(.txt, .csv等)を直接ドロップすることにも対応しています。
復元候補を確認
入力と同時に全てのエンコーディング変換パターンが自動検証・リストアップされます。リストの中から「推奨」バッジが付いた自然な結果をお探しください。
結果をコピー
正しく復元された結果のブロック内にある「コピー」ボタンをクリックすることで、クリップボードにクリーンな文字列がコピーされます。
用語集
- 文字化け (Mojibake)
- テキストを作った環境と読み込む環境で「文字コード(エンコーディング)」が一致せず、「縺ゅ>縺」のように文字がデタラメな記号等で表示されてしまう現象のこと。
- UTF-8
- 現在世界のインターネットで最も標準となっている文字コード。多言語に対応していますが、古いWindowsなどでShift_JISとして誤って読み込まれると文字化けを起こします。
- Shift_JIS (SJIS)
- Windows OSなどで古くから使われている日本語特有の文字コード。Macなどで作成されたUTF-8文字列をSJIS環境で開くと「縺」などの特有の文字化けが発生します。
- EUC-JP / ISO-2022-JP
- EUC-JPは古いLinux/UNIXサーバーで、ISO-2022-JP(JISコード)は昔の電子メールの送受信で標準的に使われていた日本語文字コードです。
- エンコード (Encode)
- 文字列を特定の文字コード規則(UTF-8等)に従ってコンピューターが扱えるバイトデータ(0と1の羅列)に変換すること。
- デコード (Decode)
- バイトデータを文字コードの規則に従って元の人間が読める文字列に戻すこと。この解釈ルールを間違えると文字化けが起こります。
- TextEncoder / TextDecoder API
- 最新のブラウザに標準搭載されている、文字コードの変換を行うJavaScriptの機能。本ツールはこれを利用し、様々な文字コードパターンを総当りで検証して復元します。
技術解説
なぜ文字化けが起きるのか
テキストデータは内部的にバイト列(0と1の並び)として保存されています。同じバイト列でも、どのエンコーディングルールで解釈するかによって表示される文字が変わります。送信側が「Shift_JIS」として書き出したバイト列を、受信側が誤って「UTF-8」として表示しようとしたときに不整合(文字化け)が発生します。
代表的な文字化けパターン
- UTF-8 → Shift_JISで誤読: 「繧」「縺」「繝」などの漢字が連続する特徴的なパターン。Web上で最も多い文字化けです。
- Shift_JIS → UTF-8で誤読: 制御文字や代替文字が含まれるパターン。古いCSVで発生します。
本ツールの復元原理と対応パターン
すべての処理はモダンブラウザの TextDecoder API を使用しています。入力された文字化けテキストの各文字のコードポイントを取得し、様々なエンコーディングとしてデコードを総当たり(ブルートフォース)することで復元を行います。
- 単段変換(19パターン): 1回のエンコーディング誤読(UTF-8 ↔ SJISなど)で発生する文字化けを復元します。
- 多段変換(10パターン): 2回以上の誤変換(二重化け: SJIS→CP1252→UTF-8など)を経た複雑な連鎖的文字化けの復元を試みます。
主な活用シーン
古いメールの復元
ISO-2022-JPやShift_JISで送信された過去のメールの文字コード不整合解消に。
CSV表計算の修正
Excel等で開いて文字化けしたファイルや、異なるOS間でのデータ受け渡しに。
Webスクレイピング
スクレイピング等で自動取得したデータの想定外のエンコーディング破損復元に。
レガシーシステム移行
古いオンプレミス環境から新システムへ移行する際のデータエンコード変換に。
海外製アプリの文字化け
海外製アプリケーション上で日本語が正しく表示されない場合のテキスト抽出に。
古いファイルの復活
Win95/98時代のシフトJIS系テキストを、現代のMac/Win環境で正しく読むために。
よくある質問
- Q.復元できない文字化けがあるのはなぜですか?
- 文字コードの誤変換だけでなく、途中で「Windows-1252」などで保存される等してデータの一部(バイト欠落)が不可逆的に失われている場合は、元のテキストを復元することは不可能です。
- Q.機密情報の入った文字化けメールを解読しても安全ですか?
- はい、安全です。本ツールはサーバーにデータを送信せず、お使いのブラウザ内部のJavaScriptエンジンのみを利用して検証・解読を行うため、外部漏洩の心配はありません。
- Q.「UTF-8 → Shift_JIS」のようなパターンとは何ですか?
- 本来は「UTF-8」で作られたデータを、開く側のソフトが誤って「Shift_JIS」として解釈してしまったという【文字化けの原因となった誤解釈の歴史】を示しています。
- Q.どれが正しい復元結果かわかりません。
- 本ツールは代表的な誤変換パターンを総当たりで計算し、結果を一覧表示します。一覧の中から最も「日本語として意味が通じている文章」を目視で見つけてください。
- Q.「縺ゅ>縺」のような文字化けは直りますか?
- はい、「縺」が含まれるのは「UTF-8で保存された日本語をShift_JISで開いた」際の典型的な文字化けパターンであり、本ツールで極めて高確率で復元可能です。
- Q.絵文字の文字化け(?や□になる現象)は直りますか?
- 残念ながら、絵文字非対応の古いシステムを経由してデータ自体が「?(クエスチョンマーク)」等に不可逆変換・上書きされてしまった場合、復元ツールでは直せません。
- Q.文字化けを未然に防ぐにはどうすればいいですか?
- ファイルを作成・保存する際に、文字コードを世界標準の「UTF-8(BOM付き/なし用途に応じて)」に統一し、受け渡し先にもUTF-8で開くよう伝えることが一番の対策です。