Fix dakuten separation on Mac
(Unicode normalization)
Instantly fixes Mac-specific filename separation in
browsers.
🔍 Analyse détaillée (points de code)
À propos
Un outil en ligne qui effectue la normalisation de texte Unicode (NFC/NFD/NFKC/NFKD) en temps réel. Vous pouvez facilement effectuer le traitement de normalisation nécessaire pour unifier les codes de caractères et les comparer.
Prend en charge les modèles de normalisation qui se produisent fréquemment dans le traitement de texte, tels que l'unification des caractères pleine chasse et demi-chasse, la combinaison/séparation de marques vocales et la normalisation des caractères compatibles. Il est également possible d'afficher des points de code de caractères et des chaînes d'octets.
Tous les traitements sont effectués dans le navigateur et aucune donnée n'est envoyée au navigateur.
Comment utiliser
Entrer le texte
Entrez ou collez le texte que vous souhaitez normaliser dans le champ de saisie.
Sélectionner le format
Sélectionnez le format de normalisation : NFC, NFD, NFKC ou NFKD.
Confirmer/Copier le résultat
Vérifiez les modifications du texte et des points de code après la normalisation et la copie.
Glossaire
- Unicode Normalization
- The process of converting text to a canonical Unicode form so that different code-point sequences representing the same character are treated identically.
- NFC (Canonical Composition)
- Decomposes characters and then recomposes them into precomposed form. The most widely used normalization form for web content and general text processing.
- NFD (Canonical Decomposition)
- Decomposes characters into a base character plus combining characters. Used by macOS file systems and some Unix environments.
- NFKC (Compatibility Composition)
- Converts compatibility characters (e.g., full-width alphanumerics, half-width katakana) to their standard forms and then composes. Commonly used for search and data normalization.
- Combining Characters
- Unicode code points that attach to a preceding base character rather than standing alone, such as accent marks and diacritics.
- Compatibility Characters
- Characters with distinct code points but equivalent meaning or appearance to standard forms, such as full-width ASCII, circled numbers, and half-width katakana.
- Code Point
- A unique numerical identifier assigned to each character in Unicode, written as U+XXXX (e.g., U+3042 for the hiragana character あ).
FAQ
- What is the difference between NFC and NFKC?
- NFC unifies internal encoding without changing the visible text. NFKC additionally converts compatibility characters — for example, full-width digits become half-width.
- Which form should I use?
- Use NFC for general text. Use NFKC before database storage or search indexing. Consider NFD when targeting macOS compatibility.
- Is my text sent to a server?
- No. All normalization runs locally in your browser. Your text is never transmitted to any external server.
- Can normalization delete characters?
- Normally no. However, NFKC may visually alter characters — for example, converting full-width letters to their half-width equivalents.
- Why does string comparison need normalization?
- The same visible character can have different internal encodings. Normalizing to a common form ensures that comparisons and searches work reliably.
- Is this especially useful for Japanese text?
- Yes. Japanese documents often mix full-width and half-width characters. Normalization resolves these inconsistencies and improves data quality.
- How do I copy the result?
- Click the copy button above the output area to save the normalized text to your clipboard.
Cas d'utilisation
Unification de la base de données
Assurer l'uniformité des données en normalisant les entrées des utilisateurs.
Comparaison de chaînes
Réalisez des comparaisons et des recherches précises à l'aide de chaînes normalisées.
Prétraitement du texte
Appliquer la normalisation comme prétraitement pour le traitement du langage naturel et l'analyse des données.
Enquête sur le code de caractère
Vérifiez le point de code du caractère. Pour enquêter sur les problèmes d’encodage.
Technique
API String.prototype.normalize()
Étant donné que seules les fonctions natives spécifiques au navigateur sont utilisées, même les données de chaîne volumineuses peuvent être normalisées instantanément dans quelques millisecondes.