digtools
🔤
mojibake fixer,

Mojibake Fixer & Encoding Converter

Corrigez instantanément le texte illisible (Mojibake). Un convertisseur d'encodage de texte fonctionnant dans le navigateur.

🔒️
Traitement dans le navigateur
Rien n'est envoyé à un navigateur
⚡️
Aucune inscription requise
Utilisez instantanément sans créer de compte
✨️
Récupération instantanée
Collez le texte pour voir toutes les conversions d'encodage

Text to Restore

0 chars
Drop file to load
about,

What is the Mojibake Fixer?

This free online tool automatically restores garbled (Mojibake) text just by pasting it. It auto-detects all conversion patterns between UTF-8 / Shift_JIS / EUC-JP / ISO-2022-JP and presents the most natural result.

All processing runs entirely in your browser via JavaScript — your sensitive data is never sent to any external server. No registration or login required, so you can use it with complete privacy.

how to,

How to Recover

STEP 1

Enter Text

Paste garbled text into the input area. You can also drag & drop text files (.txt, .csv) with broken encoding.

STEP 2

Check Candidates

All encoding conversion patterns are automatically verified and listed. Look for the result with the "Recommended" badge.

STEP 3

Copy Result

Click the "Copy" button in the correctly restored result block to copy the clean text to your clipboard.

glossary,

Glossary

Mojibake (Scrambled Text)
A phenomenon where the character encoding used to save a text doesn't match the encoding used to read it, resulting in scrambled, unreadable symbols (e.g., "縺ゅ>縺").
UTF-8
The universal character encoding standard of the modern web, encompassing almost all global languages. Often scrambles when mistakenly read by older software using legacy encodings.
Shift_JIS
A legacy character encoding heavily used in older Japanese Windows systems. Opening UTF-8 Japanese text in a Shift_JIS environment causes very specific Mojibake patterns.
EUC-JP / ISO-2022-JP
EUC-JP originates from older Unix/Linux platforms, while ISO-2022-JP (JIS) was the strict standard for early internet emails in Japan. Both can cause decoding mismatches.
Encoding / Decoding
Encoding transforms human-readable text into byte arrays based on a specific standard. Decoding translates bytes back to text. A mismatch during decoding causes Mojibake.
Irreversible Data Loss
When text is scrambled, sometimes bytes are entirely discarded or swapped with a literal "?" symbol by old databases, rendering it mathematically impossible to recover.
Brute-force Analysis
The tool's methodology of exhaustively testing multiple combinations of legacy encoding -> modern decoding vectors to find the one combination that reveals readable text.
faq,

FAQ

Q.Mon texte est-il envoyé à un navigateur ?
Non. Tout le traitement s’effectue entièrement dans votre navigateur. Les données ne sont jamais envoyées ou stockées sur un navigateur externe, ce qui permet de décoder en toute sécurité les e-mails professionnels confidentiels.
Q.Puis-je réparer le fichier CSV mojibake ?
Oui. Faites glisser et déposez le fichier CSV tronqué ou sélectionnez-le via le bouton Charger le fichier. Après la restauration avec cet outil, enregistrez-le au format UTF-8 avec BOM dans un éditeur de texte afin qu'il s'ouvre correctement dans Excel.
Q.Pourquoi certains textes ne parviennent-ils pas à être récupérés ?
Si le texte brouillé a été réenregistré dans un format destructeur (comme ANSI/Windows-1252), les informations sur les octets manquants sont définitivement perdues. Le mojibake irréversible ne peut pas être mathématiquement corrigé, bien que cet outil tente d'en estimer certaines parties.
Q.Que signifie un modèle comme « UTF-8 → Shift_JIS » ?
Il représente « l'erreur » qui a provoqué le texte tronqué : le document original a été enregistré au format « UTF-8 », mais le logiciel que vous utilisez l'a ouvert par erreur en supposant qu'il s'agissait de « Shift_JIS ».
Q.Comment puis-je savoir lequel des résultats de sortie est le bon ?
L'outil affiche les tentatives de toutes les combinaisons de codage courantes. Faites simplement défiler le panneau de sortie et identifiez visuellement le bloc où les caractères japonais deviennent une phrase cohérente et lisible.
Q.Cela peut-il résoudre le problème de brouillage courant « 縺 » ?
Oui. L'apparition de caractères comme « 縺 » est la marque d'un texte UTF-8 mal ouvert en tant que Shift_JIS. Notre outil traduit facilement cela en japonais correct.
Q.Peut-il récupérer des emoji transformés en points d'interrogation (?)
En général, non. Si le logiciel ne prenait pas en charge les emojis et écrasait les caractères de 4 octets par un véritable « ? ou le caractère « □ », les données originales sont détruites et ne peuvent pas être récupérées.
Q.Comment puis-je empêcher que Mojibake n'arrive à mon équipe ?
Assurez-vous que tous les membres de l'équipe configurent leurs éditeurs de texte, IDE, bases de données et paramètres d'exportation CSV pour utiliser la norme universelle « UTF-8 » afin d'éliminer complètement les incohérences d'encodage.
use cases,

Cas d'utilisation

📧

Récupération de texte par e-mail

Restore garbled text from emails sent with ISO-2022-JP or Shift_JIS encoding.

📂

Réparation de fichiers CSV

Fix mojibake in CSV files opened in Excel, including UTF-8 BOM issues.

🌐

Récupération de données Web

Repair garbled text from databases or API responses caused by encoding mismatches.

📋

Migration du système existant

Convert corrupted text from old systems into proper UTF-8 encoding.

technology,

Technical Details

Why Does Mojibake Occur?

Text data is stored internally as byte sequences. The same bytes produce different characters depending on which encoding rule is used to interpret them. Mojibake occurs when the receiver tries to display bytes written in "Shift_JIS" as if they were "UTF-8".

Common Mojibake Patterns

  • UTF-8 → Shift_JIS misread: Characterized by consecutive kanji like "繧" "縺" "繝". The most common mojibake on the web.
  • Shift_JIS → UTF-8 misread: Contains control or replacement characters. Common in old CSV files.

How This Tool Works & Supported Patterns

All processing uses the modern browser TextDecoder API. It extracts each character's code point from the garbled text and brute-forces decoding across all encoding combinations to find the correct restoration.

  • Single-stage (19 patterns): Restores mojibake caused by one encoding misread (e.g., UTF-8 ↔ SJIS).
  • Multi-stage (10 patterns): Attempts to restore complex chained mojibake from 2+ misconversions (e.g., SJIS→CP1252→UTF-8).

Avis Légal

Les outils fournis sur ce site sont entièrement gratuits, mais veuillez les utiliser à vos propres risques. Nous ne garantissons ni l'exactitude, ni l'exhaustivité, ni la sécurité des résultats de calcul, de conversion ou des données générées. L'exploitant décline toute responsabilité pour tout dommage ou problème causé par l'utilisation de ces outils. La plupart des outils traitent les fichiers et les calculs localement dans votre navigateur, ce qui signifie que vos données saisies ne sont ni envoyées ni stockées sur nos serveurs.