digtools
🔤
mojibake fixer,

Réparateur de Mojibake

Corrigez instantanément le texte illisible (Mojibake). Un convertisseur d'encodage de texte fonctionnant dans le navigateur.

🔒️
Traitement dans le navigateur
Rien n'est envoyé à un serveur
⚡️
Aucune inscription requise
Utilisez instantanément sans créer de compte
✨️
Récupération instantanée
Collez le texte pour voir toutes les conversions d'encodage

Texte à Restaurer

0 chars
Déposer le fichier pour charger
about,

Présentation de l'outil de correction Mojibake

Cet outil en ligne gratuit restaure automatiquement le texte brouillé (Mojibake) simplement en le collant. Que vous ayez reçu des caractères illisibles lors d'un transfert de fichiers entre Windows et Mac, ou que vous ayez extrait des données corrompues d'un ancien système, cet outil résout instantanément les problèmes d'encodage de caractères.

Il détecte et teste automatiquement tous les modèles de conversion entre UTF-8, Shift_JIS (SJIS / CP932), EUC-JP et ISO-2022-JP, puis affiche le résultat le plus naturel et cohérent — vous épargnant ainsi la tâche fastidieuse de deviner manuellement quel encodage a été utilisé.

L'ensemble du traitement s'exécute entièrement dans votre navigateur. Vos données sensibles, y compris les documents confidentiels et les informations clients, ne sont jamais transmises ni stockées sur un serveur externe. Aucune installation de logiciel, création de compte ou connexion n'est requise — ce qui en fait un outil suffisamment sûr et privé pour une utilisation professionnelle quotidienne.

cause,

Pourquoi le Mojibake se produit-il ? Causes courantes expliquées

L'incompatibilité d'encodage est la cause principale

Sur un ordinateur, toutes les données textuelles sont stockées sous forme de séquences de nombres (octets — des zéros et des uns). Le système de règles qui associe ces nombres à des caractères lisibles par l'homme s'appelle un « encodage de caractères » (comme UTF-8 ou Shift_JIS).

Par exemple, le même caractère japonais « あ » est représenté par des valeurs d'octets totalement différentes en UTF-8 et en Shift_JIS. Si l'expéditeur enregistre un fichier en Shift_JIS, mais que le logiciel du destinataire l'ouvre par erreur en UTF-8, les octets sont interprétés avec le mauvais système de règles — et l'écran affiche des caractères illisibles. C'est le Mojibake.

Motifs de Mojibake courants

  • UTF-8 mal lu en tant que Shift_JIS :
    Le type de mojibake le plus courant sur le web. Vous verrez apparaître des kanjis inhabituels comme « 繧 », « 縺 » et « 繝 » dans de longues chaînes incompréhensibles. Cela se produit fréquemment lorsqu'un fichier créé sur Mac est ouvert avec un ancien logiciel Windows.
  • Shift_JIS mal lu en tant que UTF-8 :
    La plupart des caractères sont remplacés par « » (le losange noir avec un point d'interrogation) ou des « ? » littéraux. Si le texte a été enregistré après ce remplacement, les données d'octets originales sont définitivement perdues, rendant toute récupération complète impossible.
how to,

Comment corriger le Mojibake — Guide étape par étape

ÉTAPE 1

Coller le texte brouillé

Collez le texte brouillé que vous souhaitez décoder dans la zone de saisie ci-dessus. Vous pouvez également glisser-déposer directement des fichiers texte (.txt, .csv) dont l'encodage est cassé.

ÉTAPE 2

Choisir le résultat correct

Des dizaines de modèles de conversion d'encodage sont automatiquement testés en arrière-plan. Parcourez les résultats et repérez celui portant le badge « ★ Recommandé » — il indique le texte japonais le plus naturellement lisible.

ÉTAPE 3

Copier ou essayer la conversion manuelle

Cliquez sur le bouton « Copier » du résultat correctement restauré pour enregistrer le texte propre dans votre presse-papiers. Si la détection automatique ne produit pas le bon résultat, utilisez le panneau « Conversion manuelle d'encodage » pour spécifier vous-même la paire d'encodage exacte.

glossary,

Glossaire du Mojibake et de l'encodage

Mojibake (Texte Brouillé)
Un phénomène d'erreur où l'encodage de caractères utilisé pour créer et enregistrer un fichier texte ne correspond pas à l'encodage utilisé pour l'ouvrir et le lire, provoquant l'affichage de symboles brouillés et incompréhensibles (par exemple, « 縺ゅ>縺 »). Un outil de conversion de codes de caractères est nécessaire pour restaurer l'encodage correct.
UTF-8 (Unicode Transformation Format)
La norme d'encodage de caractères la plus largement adoptée sur l'internet moderne et dans les systèmes d'exploitation (une variante d'Unicode). Elle peut gérer simultanément des caractères de pratiquement toutes les langues, mais est fréquemment mal interprétée comme Shift_JIS par les anciens logiciels Windows, provoquant le mojibake.
Shift_JIS (SJIS / CP932)
Un encodage de caractères historique spécifique à la langue japonaise, largement utilisé dans les anciens environnements Windows. L'ouverture d'un texte UTF-8 moderne dans une application Shift_JIS uniquement (comme les anciennes versions d'Excel) produit le motif de mojibake caractéristique « 縺 ».
EUC-JP / ISO-2022-JP
L'EUC-JP était couramment utilisé sur les anciens serveurs Linux et Unix. L'ISO-2022-JP (également connu sous le nom d'encodage JIS) était la norme pour les premiers e-mails japonais. Les deux restent des sources de mojibake lors de l'interfaçage avec les systèmes modernes.
Encode
Le processus de conversion du texte lisible par l'homme en une séquence d'octets (données numériques) selon une norme d'encodage de caractères spécifique comme UTF-8 ou Shift_JIS, afin que les ordinateurs puissent le stocker et le traiter.
Decode
Le processus inverse : convertir les données d'octets en texte lisible par l'homme selon un système de règles d'encodage de caractères. Lorsque le mauvais système de règles est appliqué lors du décodage, le mojibake apparaît à l'écran.
faq,

Questions fréquentes sur le Mojibake

Q.Mon texte est-il envoyé à un serveur ?
Non. Tout le traitement s'effectue entièrement dans votre navigateur. Les données ne sont jamais envoyées ou stockées sur un serveur externe, ce qui permet de décoder en toute sécurité les e-mails professionnels confidentiels.
Q.Puis-je réparer le fichier CSV mojibake ?
Oui. Faites glisser et déposez le fichier CSV tronqué ou sélectionnez-le via le bouton Charger le fichier. Après la restauration avec cet outil, enregistrez-le au format UTF-8 avec BOM dans un éditeur de texte afin qu'il s'ouvre correctement dans Excel.
Q.Pourquoi certains textes ne parviennent-ils pas à être récupérés ?
Si le texte brouillé a été réenregistré dans un format destructeur (comme ANSI/Windows-1252), les informations sur les octets manquants sont définitivement perdues. Le mojibake irréversible ne peut pas être mathématiquement corrigé, bien que cet outil tente d'en estimer certaines parties.
Q.Que signifie un modèle comme « UTF-8 → Shift_JIS » ?
Il représente « l'erreur » qui a provoqué le texte tronqué : le document original a été enregistré au format « UTF-8 », mais le logiciel que vous utilisez l'a ouvert par erreur en supposant qu'il s'agissait de « Shift_JIS ».
Q.Comment puis-je savoir lequel des résultats de sortie est le bon ?
L'outil affiche les tentatives de toutes les combinaisons de codage courantes. Faites simplement défiler le panneau de sortie et identifiez visuellement le bloc où les caractères japonais deviennent une phrase cohérente et lisible.
Q.Cela peut-il résoudre le problème de brouillage courant « 縺 » ?
Oui. L'apparition de caractères comme « 縺 » est la marque d'un texte UTF-8 mal ouvert en tant que Shift_JIS. Notre outil traduit facilement cela en japonais correct.
Q.Peut-il récupérer des emoji transformés en points d'interrogation (?)
En général, non. Si le logiciel ne prenait pas en charge les emojis et écrasait les caractères de 4 octets par un véritable « ? ou le caractère « □ », les données originales sont détruites et ne peuvent pas être récupérées.
Q.Comment puis-je empêcher que Mojibake n'arrive à mon équipe ?
Assurez-vous que tous les membres de l'équipe configurent leurs éditeurs de texte, IDE, bases de données et paramètres d'exportation CSV pour utiliser la norme universelle « UTF-8 » afin d'éliminer complètement les incohérences d'encodage.
use cases,

Cas courants de Mojibake et solutions

Voici les situations les plus courantes où le mojibake se produit, accompagnées de solutions pratiques.

📂

Fichiers CSV brouillés à l'ouverture dans Excel

Lorsque vous ouvrez un fichier CSV encodé en UTF-8 (par exemple, exporté depuis une application web) en double-cliquant dessus dans Windows Excel, Excel peut tenter de le lire en Shift_JIS, provoquant le mojibake.

Solution : Déposez le fichier dans cet outil pour le restaurer, ou utilisez l'onglet « Données » d'Excel → l'assistant d'importation « À partir d'un fichier texte/CSV » et spécifiez UTF-8 comme encodage d'origine.

📧

E-mails reçus illisibles

Cela se produit lorsque le client de messagerie de l'expéditeur utilise un encodage ancien comme ISO-2022-JP ou EUC-JP, mais que le logiciel de messagerie du destinataire (Outlook, Gmail, etc.) tente de le traiter en UTF-8.

Solution : Copiez l'intégralité du corps de l'e-mail brouillé et collez-le dans la zone de saisie de cet outil pour décoder et restaurer le message original.

🗜️

Noms de fichiers ZIP brouillés entre Mac et Windows

Lorsqu'un fichier ZIP créé sur Mac est extrait sur Windows avec l'extracteur intégré, les noms de fichiers peuvent devenir illisibles. Cela est dû au fait que Mac stocke les noms de fichiers en UTF-8, tandis que Windows tente de les interpréter en Shift_JIS.

Solution : Utilisez un outil d'extraction compatible UTF-8 comme 7-Zip, ou utilisez un utilitaire de compression compatible Windows côté Mac.

🌐

Site web entièrement brouillé dans le navigateur

Cela se produit lorsque la balise meta du fichier HTML (déclaration charset) ne correspond pas à l'encodage réel dans lequel le fichier a été enregistré.

Solution : Utilisez une extension de navigateur pour changer manuellement l'encodage du texte, ou l'administrateur du site doit corriger la déclaration charset dans le HTML.

technology,

Fonctionnement de l'algorithme de récupération (détails techniques)

Traitement sécurisé et natif du navigateur via l'API TextDecoder

Pour restaurer le mojibake, cet outil exploite les API TextEncoder et TextDecoder intégrées aux navigateurs modernes. Il extrait les points de code du texte brouillé en entrée et effectue la conversion d'octets et le re-décodage à travers tous les encodages pris en charge — entièrement côté client.

Cela signifie qu'aucune donnée n'est jamais envoyée à un serveur externe, rendant le processus de réparation extrêmement sécurisé et rapide.

Détection automatique par force brute et notation

Pour chaque entrée donnée, l'outil exécute des dizaines de tests de conversion de manière asynchrone en arrière-plan :

  • Conversion en une seule étape (19 modèles) : Couvre tous les mojibake courants causés par une seule mauvaise interprétation d'encodage (par ex., des données réellement en UTF-8 mais ouvertes en tant que Shift_JIS).
  • Multi-étapes / double mojibake (10 modèles) : Traite les cas complexes où les données sont passées par plusieurs systèmes et ont été mal converties deux fois ou plus (par ex., corruption en chaîne SJIS → CP1252 → UTF-8).

Chaque résultat est noté à l'aide d'un algorithme propriétaire qui évalue la fréquence des caractères japonais (hiragana, katakana, kanji courants), le ratio de caractères ASCII et la prévalence des caractères de remplacement corrompus (? ou ). Le résultat ayant le score le plus élevé — considéré comme le « japonais le plus naturel » — reçoit le badge « ★ Recommandé ».

Envoyer des commentaires

Faites-nous part de vos réflexions pour nous aider à améliorer l'outil.

Avis Légal

Les outils fournis sur ce site sont entièrement gratuits, mais veuillez les utiliser à vos propres risques. Nous ne garantissons ni l'exactitude, ni l'exhaustivité, ni la sécurité des résultats de calcul, de conversion ou des données générées. L'exploitant décline toute responsabilité pour tout dommage ou problème causé par l'utilisation de ces outils. La plupart des outils traitent les fichiers et les calculs localement dans votre navigateur, ce qui signifie que vos données saisies ne sont ni envoyées ni stockées sur nos serveurs.