digtools
📝
jp text normalizer

Full-width half-width conversion tool
(Katakana/Alphanumeric)

Batch normalizes notation variations such as full-width alphanumeric characters, half-width katakana, and full-width spaces.

⚡️
Traitement dans le navigateur
Aucune donnée n'est envoyée à un serveur
✨️
No Registration
Aucun compte requis — utilisez immédiatement
🛡️
Instant Presets
Apply common settings instantly, with fine-tuning options

* Le contenu est traité dans votre navigateur — aucune donnée n'est envoyée au serveur.

⚙️ Options avancées
about

Aperçu

This is a tool that normalizes "fluctuations" such as full-width alphanumeric characters, half-width katakana, and full-width spaces in Japanese text all at once. It can be used in a variety of situations, such as form input preprocessing, data cleansing, and manuscript proofreading.

In addition to 5 presets (for form input, half-width alphanumeric characters, full-width kana, all hiragana, and all katakana), it also includes advanced options such as individual settings for alphanumeric characters, symbols, spaces, kana width, and kana type, unifying line breaks, deleting spaces at the end of lines, and converting tabs. You can visually check the changes with the difference highlighting.

All processing is completed within the browser and no data is sent to an external server. No member registration or installation required; just paste the text and you can start normalizing immediately.

how to use

Comment utiliser

STEP 1

Enter text

Paste the text you want to normalize into the input field. It supports all types of text, including form input, CSV, and manuscripts.

STEP 2

Preset options

"Auto-update" ON to adjust advanced options or choose a preset.

STEP 3

Copy result

Check, copy, and save the normalized text and differential highlighting results.

glossary

Glossaire

Half-width to Full-width Kana
Converts legacy half-width Japanese katakana ("アイウエオ") into standard full-width katakana ("アイウエオ"). Essential for modern web readability.
Full-width to Half-width Alphanumeric
Converts wide English letters and numbers ("123ABC") to standard ASCII half-width format ("123ABC"). Critical for database validation.
Unicode Normalization (NFC/NFD)
The process of unifying different internal byte representations of the same character. For example, ensuring "が" is a single character rather than "か" + "゛".
Machine Dependent Characters
Old proprietary glyphs (like circled numbers or specific Roman numerals) that cause mojibake (scrambled text) on modern systems. Best to normalize them out.
Orthographical Variance
Inconsistencies in text, such as multiple ways to write "apple" in Japanese (りんご, リンゴ, 林檎). Normalizing helps search engines accurately index text.
Whitespace Trimming
The removal or standardization of spaces. It includes converting Japanese wide spaces to standard ASCII spaces, stripping end-of-line spaces, and collapsing multiple spaces.
Regex Processing
The underlying technology (Regular Expressions) used by the tool to instantly locate and swap millions of character patterns directly in your browser.
faq

FAQ

Q.Je souhaite convertir des caractères alphanumériques pleine chasse en demi-chasse. Quel préréglage dois-je choisir ?
Veuillez sélectionner le préréglage « Caractères alphanumériques → demi-chasse uniquement ». Seuls les caractères alphanumériques et les symboles sont convertis en demi-largeur, et les katakana et hiragana sont conservés tels quels.
Q.Je veux convertir un katakana demi-largeur en pleine largeur
Veuillez sélectionner le préréglage « Kana demi-largeur → Kana pleine largeur uniquement ». Les kana demi-chasse avec des marques sonores et demi-voix sont également correctement combinés en un seul caractère pleine chasse.
Q.Pouvez-vous convertir le katakana en hiragana ?
Oui. Vous pouvez convertir tous les fichiers en même temps en utilisant le préréglage « Tous les Hiragana ». Il peut également être défini individuellement dans « Type Kana » dans les options avancées.
Q.Mes données textuelles sont-elles sécurisées ?
Entièrement sécurisé. Toutes les opérations de traitement de texte et d'expression régulière sont exécutées en temps réel dans votre navigateur Web. Rien n'est jamais envoyé ou traité par des navigateurs externes.
Q.Puis-je coller des colonnes directement depuis Excel/Google Sheets ?
Oui. Vous pouvez copier une colonne entière de données client désordonnées, la coller, normaliser les caractères alphanumériques et la recoller directement dans votre feuille de calcul.
Q.Puis-je désactiver la conversion des espaces pleine largeur ?
Oui. Vous disposez d'un contrôle granulaire via le panneau de paramètres. Décochez simplement la case associée si vous souhaitez conserver les espaces japonais pleine largeur.
Q.Est-ce que cela corrigera les marques dakuten séparées comme « か » + « ゙ » ?
Oui. L'outil détecte automatiquement les dakuten séparés (marques vocales) et les fusionne intelligemment en caractères uniques et standardisés (par exemple, « が »).
Q.Quels sont les cas d’utilisation typiques de ce normalisateur ?
Inestimable pour le nettoyage des données des soumissions de formulaires, la migration des bases de données existantes, la désinfection des catalogues de produits de commerce électronique et la normalisation du formatage avant l'envoi aux presses à imprimer.
Q.Trait-il correctement les sauts de ligne ?
Oui. Il préserve vos sauts de ligne existants (ou les standardise en LF/CRLF en fonction des paramètres) tout en traitant le texte ligne par ligne sans fusionner les paragraphes.
Q.Y a-t-il une limite à la quantité de texte que je peux traiter ?
Parce qu'il utilise du JavaScript local hautement optimisé, il peut gérer confortablement des dizaines de milliers de caractères en millisecondes sans geler le navigateur.
use cases

Cas d'utilisation

Prétraitement de formulaire

Ideal for validation steps before storing in the database.

Nettoyage de CSV

Improved aggregation accuracy by eliminating the mixture of full-width and half-width characters and inconsistent spacing.

Relecture de manuscrits et articles

Difference display allows you to visually confirm changes, greatly improving proofreading efficiency.

Prétraitement de programme

Uniformly match full-width and half-width characters before processing user input.

technology

Détails techniques

Character code conversion mechanism

Full-width ↔ half-width conversion is implemented by offset calculation of Unicode code points. The difference between full-width alphanumeric characters and half-width characters is fixed at 0xFEE0, so they can be converted quickly by just adding and subtracting.

Kana conversion algorithm

Unicode normalization (NFKC) is used to convert from half-width kana to full-width kana. Half-width kana with voiced marks (e.g. ga) is two characters, but NKFC combines it into one full-width character (ga).

Difference display (Myers diff)

Myers for calculating the difference before and after the change It uses a diff algorithm to calculate deletions (red) and insertions (green) for each character and highlights them.

Avis Légal

Les outils fournis sur ce site sont entièrement gratuits, mais veuillez les utiliser à vos propres risques. Nous ne garantissons ni l'exactitude, ni l'exhaustivité, ni la sécurité des résultats de calcul, de conversion ou des données générées. L'exploitant décline toute responsabilité pour tout dommage ou problème causé par l'utilisation de ces outils. La plupart des outils traitent les fichiers et les calculs localement dans votre navigateur, ce qui signifie que vos données saisies ne sont ni envoyées ni stockées sur nos serveurs.