Mojibake Fixer & Encoding Converter
Corrigez instantanément le texte illisible (Mojibake).
Un convertisseur d'encodage de texte fonctionnant dans le navigateur.
Text to Restore
Now that your text is fixed, try these tools next
What is the Mojibake Fixer?
This free online tool automatically restores garbled (Mojibake) text just by pasting it. It auto-detects all conversion patterns between UTF-8 / Shift_JIS / EUC-JP / ISO-2022-JP and presents the most natural result.
All processing runs entirely in your browser via JavaScript — your sensitive data is never sent to any external server. No registration or login required, so you can use it with complete privacy.
How to Recover
Enter Text
Paste garbled text into the input area. You can also drag & drop text files (.txt, .csv) with broken encoding.
Check Candidates
All encoding conversion patterns are automatically verified and listed. Look for the result with the "Recommended" badge.
Copy Result
Click the "Copy" button in the correctly restored result block to copy the clean text to your clipboard.
Glossary
- Mojibake (Scrambled Text)
- A phenomenon where the character encoding used to save a text doesn't match the encoding used to read it, resulting in scrambled, unreadable symbols (e.g., "縺ゅ>縺").
- UTF-8
- The universal character encoding standard of the modern web, encompassing almost all global languages. Often scrambles when mistakenly read by older software using legacy encodings.
- Shift_JIS
- A legacy character encoding heavily used in older Japanese Windows systems. Opening UTF-8 Japanese text in a Shift_JIS environment causes very specific Mojibake patterns.
- EUC-JP / ISO-2022-JP
- EUC-JP originates from older Unix/Linux platforms, while ISO-2022-JP (JIS) was the strict standard for early internet emails in Japan. Both can cause decoding mismatches.
- Encoding / Decoding
- Encoding transforms human-readable text into byte arrays based on a specific standard. Decoding translates bytes back to text. A mismatch during decoding causes Mojibake.
- Irreversible Data Loss
- When text is scrambled, sometimes bytes are entirely discarded or swapped with a literal "?" symbol by old databases, rendering it mathematically impossible to recover.
- Brute-force Analysis
- The tool's methodology of exhaustively testing multiple combinations of legacy encoding -> modern decoding vectors to find the one combination that reveals readable text.
FAQ
- Q.Mon texte est-il envoyé à un navigateur ?
- Non. Tout le traitement s’effectue entièrement dans votre navigateur. Les données ne sont jamais envoyées ou stockées sur un navigateur externe, ce qui permet de décoder en toute sécurité les e-mails professionnels confidentiels.
- Q.Puis-je réparer le fichier CSV mojibake ?
- Oui. Faites glisser et déposez le fichier CSV tronqué ou sélectionnez-le via le bouton Charger le fichier. Après la restauration avec cet outil, enregistrez-le au format UTF-8 avec BOM dans un éditeur de texte afin qu'il s'ouvre correctement dans Excel.
- Q.Pourquoi certains textes ne parviennent-ils pas à être récupérés ?
- Si le texte brouillé a été réenregistré dans un format destructeur (comme ANSI/Windows-1252), les informations sur les octets manquants sont définitivement perdues. Le mojibake irréversible ne peut pas être mathématiquement corrigé, bien que cet outil tente d'en estimer certaines parties.
- Q.Que signifie un modèle comme « UTF-8 → Shift_JIS » ?
- Il représente « l'erreur » qui a provoqué le texte tronqué : le document original a été enregistré au format « UTF-8 », mais le logiciel que vous utilisez l'a ouvert par erreur en supposant qu'il s'agissait de « Shift_JIS ».
- Q.Comment puis-je savoir lequel des résultats de sortie est le bon ?
- L'outil affiche les tentatives de toutes les combinaisons de codage courantes. Faites simplement défiler le panneau de sortie et identifiez visuellement le bloc où les caractères japonais deviennent une phrase cohérente et lisible.
- Q.Cela peut-il résoudre le problème de brouillage courant « 縺 » ?
- Oui. L'apparition de caractères comme « 縺 » est la marque d'un texte UTF-8 mal ouvert en tant que Shift_JIS. Notre outil traduit facilement cela en japonais correct.
- Q.Peut-il récupérer des emoji transformés en points d'interrogation (?)
- En général, non. Si le logiciel ne prenait pas en charge les emojis et écrasait les caractères de 4 octets par un véritable « ? ou le caractère « □ », les données originales sont détruites et ne peuvent pas être récupérées.
- Q.Comment puis-je empêcher que Mojibake n'arrive à mon équipe ?
- Assurez-vous que tous les membres de l'équipe configurent leurs éditeurs de texte, IDE, bases de données et paramètres d'exportation CSV pour utiliser la norme universelle « UTF-8 » afin d'éliminer complètement les incohérences d'encodage.
Cas d'utilisation
Récupération de texte par e-mail
Restore garbled text from emails sent with ISO-2022-JP or Shift_JIS encoding.
Réparation de fichiers CSV
Fix mojibake in CSV files opened in Excel, including UTF-8 BOM issues.
Récupération de données Web
Repair garbled text from databases or API responses caused by encoding mismatches.
Migration du système existant
Convert corrupted text from old systems into proper UTF-8 encoding.
Technical Details
Why Does Mojibake Occur?
Text data is stored internally as byte sequences. The same bytes produce different characters depending on which encoding rule is used to interpret them. Mojibake occurs when the receiver tries to display bytes written in "Shift_JIS" as if they were "UTF-8".
Common Mojibake Patterns
- UTF-8 → Shift_JIS misread: Characterized by consecutive kanji like "繧" "縺" "繝". The most common mojibake on the web.
- Shift_JIS → UTF-8 misread: Contains control or replacement characters. Common in old CSV files.
How This Tool Works & Supported Patterns
All processing uses the modern browser TextDecoder API. It extracts each character's code point from the garbled text and brute-forces decoding across all encoding combinations to find the correct restoration.
- Single-stage (19 patterns): Restores mojibake caused by one encoding misread (e.g., UTF-8 ↔ SJIS).
- Multi-stage (10 patterns): Attempts to restore complex chained mojibake from 2+ misconversions (e.g., SJIS→CP1252→UTF-8).