Full-width half-width conversion tool
(Katakana/Alphanumeric)
Batch normalizes
notation variations such as full-width alphanumeric characters, half-width katakana, and full-width spaces.
* Le contenu est traité dans votre navigateur — aucune donnée n'est envoyée au serveur.
⚙️ Options avancées ▼
Affichage des différences (Diff Myers)
Avant
Après
Aperçu
This is a tool that normalizes "fluctuations" such as full-width alphanumeric characters, half-width katakana, and full-width spaces in Japanese text all at once. It can be used in a variety of situations, such as form input preprocessing, data cleansing, and manuscript proofreading.
In addition to 5 presets (for form input, half-width alphanumeric characters, full-width kana, all hiragana, and all katakana), it also includes advanced options such as individual settings for alphanumeric characters, symbols, spaces, kana width, and kana type, unifying line breaks, deleting spaces at the end of lines, and converting tabs. You can visually check the changes with the difference highlighting.
All processing is completed within the browser and no data is sent to an external server. No member registration or installation required; just paste the text and you can start normalizing immediately.
Comment utiliser
Enter text
Paste the text you want to normalize into the input field. It supports all types of text, including form input, CSV, and manuscripts.
Preset options
"Auto-update" ON to adjust advanced options or choose a preset.
Copy result
Check, copy, and save the normalized text and differential highlighting results.
Glossaire
- Half-width to Full-width Kana
- Converts legacy half-width Japanese katakana ("アイウエオ") into standard full-width katakana ("アイウエオ"). Essential for modern web readability.
- Full-width to Half-width Alphanumeric
- Converts wide English letters and numbers ("123ABC") to standard ASCII half-width format ("123ABC"). Critical for database validation.
- Unicode Normalization (NFC/NFD)
- The process of unifying different internal byte representations of the same character. For example, ensuring "が" is a single character rather than "か" + "゛".
- Machine Dependent Characters
- Old proprietary glyphs (like circled numbers or specific Roman numerals) that cause mojibake (scrambled text) on modern systems. Best to normalize them out.
- Orthographical Variance
- Inconsistencies in text, such as multiple ways to write "apple" in Japanese (りんご, リンゴ, 林檎). Normalizing helps search engines accurately index text.
- Whitespace Trimming
- The removal or standardization of spaces. It includes converting Japanese wide spaces to standard ASCII spaces, stripping end-of-line spaces, and collapsing multiple spaces.
- Regex Processing
- The underlying technology (Regular Expressions) used by the tool to instantly locate and swap millions of character patterns directly in your browser.
FAQ
- Q.Je souhaite convertir des caractères alphanumériques pleine chasse en demi-chasse. Quel préréglage dois-je choisir ?
- Veuillez sélectionner le préréglage « Caractères alphanumériques → demi-chasse uniquement ». Seuls les caractères alphanumériques et les symboles sont convertis en demi-largeur, et les katakana et hiragana sont conservés tels quels.
- Q.Je veux convertir un katakana demi-largeur en pleine largeur
- Veuillez sélectionner le préréglage « Kana demi-largeur → Kana pleine largeur uniquement ». Les kana demi-chasse avec des marques sonores et demi-voix sont également correctement combinés en un seul caractère pleine chasse.
- Q.Pouvez-vous convertir le katakana en hiragana ?
- Oui. Vous pouvez convertir tous les fichiers en même temps en utilisant le préréglage « Tous les Hiragana ». Il peut également être défini individuellement dans « Type Kana » dans les options avancées.
- Q.Mes données textuelles sont-elles sécurisées ?
- Entièrement sécurisé. Toutes les opérations de traitement de texte et d'expression régulière sont exécutées en temps réel dans votre navigateur Web. Rien n'est jamais envoyé ou traité par des navigateurs externes.
- Q.Puis-je coller des colonnes directement depuis Excel/Google Sheets ?
- Oui. Vous pouvez copier une colonne entière de données client désordonnées, la coller, normaliser les caractères alphanumériques et la recoller directement dans votre feuille de calcul.
- Q.Puis-je désactiver la conversion des espaces pleine largeur ?
- Oui. Vous disposez d'un contrôle granulaire via le panneau de paramètres. Décochez simplement la case associée si vous souhaitez conserver les espaces japonais pleine largeur.
- Q.Est-ce que cela corrigera les marques dakuten séparées comme « か » + « ゙ » ?
- Oui. L'outil détecte automatiquement les dakuten séparés (marques vocales) et les fusionne intelligemment en caractères uniques et standardisés (par exemple, « が »).
- Q.Quels sont les cas d’utilisation typiques de ce normalisateur ?
- Inestimable pour le nettoyage des données des soumissions de formulaires, la migration des bases de données existantes, la désinfection des catalogues de produits de commerce électronique et la normalisation du formatage avant l'envoi aux presses à imprimer.
- Q.Trait-il correctement les sauts de ligne ?
- Oui. Il préserve vos sauts de ligne existants (ou les standardise en LF/CRLF en fonction des paramètres) tout en traitant le texte ligne par ligne sans fusionner les paragraphes.
- Q.Y a-t-il une limite à la quantité de texte que je peux traiter ?
- Parce qu'il utilise du JavaScript local hautement optimisé, il peut gérer confortablement des dizaines de milliers de caractères en millisecondes sans geler le navigateur.
Cas d'utilisation
Prétraitement de formulaire
Ideal for validation steps before storing in the database.
Nettoyage de CSV
Improved aggregation accuracy by eliminating the mixture of full-width and half-width characters and inconsistent spacing.
Relecture de manuscrits et articles
Difference display allows you to visually confirm changes, greatly improving proofreading efficiency.
Prétraitement de programme
Uniformly match full-width and half-width characters before processing user input.
Détails techniques
Character code conversion mechanism
Full-width ↔ half-width conversion is implemented by offset calculation of Unicode code points. The difference between full-width alphanumeric characters and half-width characters is fixed at 0xFEE0, so they can be converted quickly by just adding and subtracting.
Kana conversion algorithm
Unicode normalization (NFKC) is used to convert from half-width kana to full-width kana. Half-width kana with voiced marks (e.g. ga) is two characters, but NKFC combines it into one full-width character (ga).
Difference display (Myers diff)
Myers for calculating the difference before and after the change It uses a diff algorithm to calculate deletions (red) and insertions (green) for each character and highlights them.