Normalisation Unicode
(NFC/NFD/NFKC)
Résout instantanément les problèmes de séparation de caractères
(ex: NFD Mac) directement dans votre navigateur.
🔍 Analyse détaillée (points de code)
À propos
Un outil en ligne qui effectue la normalisation de texte Unicode (NFC/NFD/NFKC/NFKD) en temps réel. Vous pouvez facilement unifier les codes de caractères et les comparer.
Prend en charge les cas de normalisation courants : unification des caractères pleine chasse et demi-chasse, combinaison ou séparation des marques diacritiques, et normalisation des caractères de compatibilité. Il est également possible d'afficher les points de code.
Tous les traitements sont effectués dans le navigateur et aucune donnée n'est envoyée à un serveur.
Comment utiliser
Saisir le texte
Entrez ou collez le texte que vous souhaitez normaliser dans le champ de saisie.
Choisir le format
Sélectionnez le format de normalisation : NFC, NFD, NFKC ou NFKD.
Vérifier et copier
Vérifiez le résultat normalisé et copiez-le dans le presse-papiers.
Glossaire
- Normalisation Unicode
- Processus de conversion de texte vers une forme Unicode canonique afin que différentes séquences de points de code représentant le même caractère soient traitées de manière identique.
- NFC (Composition Canonique)
- Décompose les caractères puis les recompose sous forme précomposée. La forme de normalisation la plus utilisée pour le contenu web et le traitement de texte en général.
- NFD (Décomposition Canonique)
- Décompose les caractères en un caractère de base plus des caractères combinants. Utilisé par les systèmes de fichiers macOS et certains environnements Unix.
- NFKC (Composition de Compatibilité)
- Convertit les caractères de compatibilité (ex: alphanumériques pleine chasse, katakana demi-chasse) en leurs formes standard puis les compose. Couramment utilisé pour la recherche et la normalisation de données.
- Caractères combinants
- Points de code Unicode qui s'attachent à un caractère de base précédent plutôt que d'être autonomes, comme les marques d'accentuation et les diacritiques.
- Caractères de compatibilité
- Caractères avec des points de code distincts mais une signification ou une apparence équivalente aux formes standard, tels que l'ASCII pleine chasse, les nombres encerclés et les katakanas demi-chasse.
- Point de Code
- Identifiant numérique unique attribué à chaque caractère dans Unicode, écrit sous la forme U+XXXX (ex: U+3042 pour le caractère hiragana あ).
FAQ
- Quelle est la différence entre NFC et NFKC ?
- NFC unifie l'encodage interne sans modifier le texte visible. NFKC convertit en plus les caractères de compatibilité — par exemple, les chiffres pleine chasse deviennent demi-chasse.
- Quel format dois-je utiliser ?
- Utilisez NFC pour le texte général. Utilisez NFKC avant le stockage en base de données ou l'indexation de recherche. Envisagez NFD si vous ciblez la compatibilité macOS.
- Mon texte est-il envoyé à un serveur ?
- Non. Toute la normalisation s'effectue localement dans votre navigateur. Votre texte n'est jamais transmis à un serveur externe.
- La normalisation peut-elle supprimer des caractères ?
- Normalement non. Cependant, NFKC peut altérer visuellement les caractères — par exemple, en convertissant les lettres pleine chasse en leurs équivalents demi-chasse.
- Pourquoi la comparaison de chaînes nécessite-t-elle une normalisation ?
- Le même caractère visible peut avoir des encodages internes différents. La normalisation vers un format commun garantit que les comparaisons et les recherches fonctionnent de manière fiable.
- Est-ce particulièrement utile pour le texte japonais ?
- Oui. Les documents japonais mélangent souvent les caractères pleine et demi-chasse. La normalisation résout ces incohérences et améliore la qualité des données.
- Comment puis-je copier le résultat ?
- Cliquez sur le bouton de copie au-dessus de la zone de résultat pour enregistrer le texte normalisé dans votre presse-papiers.
Cas d'utilisation
Unification de la base de données
Normaliser les entrées utilisateurs pour garantir l'uniformité des données.
Comparaison de chaînes
Réaliser des comparaisons et des recherches précises à l'aide de chaînes normalisées.
Prétraitement du texte
Appliquer la normalisation en amont du traitement du langage naturel ou de l'analyse de données.
Inspection des points de code
Vérifier le point de code d'un caractêre pour diagnostiquer des problêmes d'encodage.
Technique
API String.prototype.normalize()
Étant donné que seules les fonctions natives spécifiques au navigateur sont utilisées, même les données de chaîne volumineuses peuvent être normalisées instantanément dans quelques millisecondes.
Envoyer des commentaires
Faites-nous part de vos réflexions pour nous aider à améliorer l'outil.
Les commentaires sont temporairement suspendus
Le serveur est occupé ou la protection anti-spam est active. Veuillez réessayer plus tard.