digtools
📝
jp text normalizer

Full-width half-width conversion tool
(Katakana/Alphanumeric)

Batch normalizes notation variations such as full-width alphanumeric characters, half-width katakana, and full-width spaces.

⚡️
Verwerking in de browser
Geen gegevens worden naar een server gestuurd
✨️
Geen registratie
Geen account nodig — direct gebruiken
🛡️
Directe Presets
Pas veelvoorkomende instellingen direct toe, met opties voor fijnafstemming

* De inhoud wordt in uw browser verwerkt — en wordt nooit naar een server gestuurd.

⚙️ Geavanceerde Opties
about

Over

Dit is een tool die "fluctuaties" zoals alfanumerieke tekens over de volledige breedte, halfbrede katakana en spaties over de volledige breedte in Japanse tekst in één keer normaliseert. Het kan worden gebruikt in een verscheidenheid aan situaties, zoals formulierinvoervoorverwerking, gegevensopschoning en manuscriptcorrectie.

Naast 5 presets (voor formulierinvoer, halfbrede alfanumerieke tekens, volledige breedte kana, allemaal hiragana en allemaal katakana), bevat het ook geavanceerde opties zoals individuele instellingen voor alfanumerieke tekens, symbolen, spaties, kana-breedte en kana-type, regeleinden verenigen, spaties aan het einde van regels verwijderen en tabbladen converteren. U kunt de wijzigingen visueel controleren met de verschilmarkering.

Alle verwerking wordt binnen de browser voltooid en er worden geen gegevens naar een externe server verzonden. Geen lidmaatschapsregistratie of installatie vereist; plak gewoon de tekst en u kunt direct beginnen met normaliseren.

how to use

Hoe te gebruiken

STAP 1

Voer tekst in

Plak de tekst die u wilt normaliseren in het invoerveld. Het ondersteunt alle soorten tekst, inclusief formulierinvoer, CSV en manuscripten.

STAP 2

Preset-opties

"Auto-update" AAN om geavanceerde opties aan te passen of een preset te kiezen.

STAP 3

Resultaat kopiëren

Controleer, kopieer en sla de genormaliseerde tekst en de differentiaalmarkeringresultaten op.

glossary

Woordenlijst

Halfbreedte naar Volledige breedte Kana
Converteert oude halfbrede Japanse katakana ("アイウエオ") naar standaard katakana van volledige breedte ("アイウエオ"). Essentieel voor de leesbaarheid op het moderne web.
Volledige breedte naar Halfbreedte Alfanumeriek
Converteert brede Engelse letters en cijfers ("123ABC") naar het standaard ASCII halfbreedte formaat ("123ABC"). Kritisch voor database validatie.
Unicode Normalisatie (NFC/NFD)
Het proces van het verenigen van verschillende interne byterecreaties van hetzelfde teken. Bijvoorbeeld door ervoor te zorgen dat "が" een enkel teken is in plaats van "か" + "゛".
Machineafhankelijke Tekens
Oude propriëtaire glyphs (zoals omcirkelde nummers of specifieke Romeinse cijfers) die mojibake (vervormde tekst) veroorzaken op moderne systemen. Het beste is om ze weg te normaliseren.
Orthografische Variantie
Inconsistenties in de tekst, zoals meerdere manieren om "appel" in het Japans te schrijven (りんご, リンゴ, 林檎). Normalisatie helpt zoekmachines om tekst nauwkeurig te indexeren.
Spaties Bijsnijden
Het verwijderen of standaardiseren van spaties. Dit omvat het converteren van brede Japanse spaties naar standaard ASCII-spaties, het weglaten van spaties aan het einde van een regel en het samenvoegen van meerdere spaties.
Reguliere Expressie Verwerking
De onderliggende technologie (Reguliere Expressies) die door de tool wordt gebruikt om miljoenen tekenpatronen direct in uw browser te lokaliseren en te verwisselen.
faq

FAQ

Q.I want to convert full-width alphanumeric characters to half-width. Which preset should I choose?
Please select the 'Alphanumeric characters → half-width only' preset. Only alphanumeric characters and symbols are converted to half-width, and katakana and hiragana are kept as is.
Q.I want to convert half-width katakana to full-width
Please select the 'half-width kana → full-width kana only' preset. Half-width kana with voiced and half-voiced marks are also correctly combined into one full-width character.
Q.Can you convert katakana to hiragana?
Yes. You can convert all files at once using the preset 'All Hiragana'. It can also be set individually in 'Kana type' in the advanced options.
Q.Is my text data secure?
Completely secure. All text processing and regex operations are executed in real-time within your web browser. Nothing is ever sent to or processed by external servers.
Q.Can I paste columns directly from Excel/Google Sheets?
Yes. You can copy a whole column of messy customer data, paste it in, normalize the alphanumeric characters, and paste it directly back into your spreadsheet cleanly.
Q.Can I disable the conversion of full-width spaces?
Yes. You have granular control via the settings panel. Simply uncheck the associated box if you wish to preserve Japanese full-width spaces.
Q.Will it fix separated dakuten marks like 'か' + '゙'?
Yes. The tool automatically detects separated dakuten (voiced marks) and intelligently merges them back into single, standardized characters (e.g., 'が').
Q.What are typical use cases for this normalizer?
Invaluable for data cleansing form submissions, migrating legacy databases, sanitizing e-commerce product catalogs, and standardizing formatting before sending to printing presses.
Q.Does it process line breaks properly?
Yes. It preserves your existing line breaks (or standardizes them to LF/CRLF depending on settings) while processing the text on a line-by-line basis without merging paragraphs.
Q.Is there a limit to how much text I can process?
Because it uses highly optimized local JavaScript, it can comfortably handle tens of thousands of characters in milliseconds without freezing the browser.
use cases

Gebruiksscenario's

Voorverwerking formulierinvoer

Ideaal voor validatiestappen voordat ze in de database worden opgeslagen.

CSV opschoning

Verbeterde aggregatienauwkeurigheid door het mengsel van volledige breedte en halfbreedte tekens en inconsistente spatiëring te elimineren.

Proeflezen van manuscripten en artikelen

Verschilweergave stelt u in staat wijzigingen visueel te bevestigen, wat de efficiëntie van proeflezen aanzienlijk verbetert.

Voorverwerking van programma's

Pas tekens van volledige breedte en halfbreedte uniform aan voordat u gebruikersinvoer verwerkt.

technology

Technisch

Tekencode conversiemechanisme

Volledige breedte ↔ halfbreedte conversie wordt geïmplementeerd door offset-berekening van Unicode-codepunten. Het verschil tussen alfanumerieke tekens met volledige breedte en halfbreedte tekens is vastgezet op 0xFEE0, dus ze kunnen snel worden geconverteerd door gewoon op te tellen en af te trekken.

Kana conversie algoritme

Unicode-normalisatie (NFKC) wordt gebruikt om van halfbrede kana naar volledige breedte kana te converteren. Halfbrede kana met stemhebbende markeringen (bijv. ga) is twee tekens, maar NKFC combineert het tot één teken van volledige breedte (ga).

Verschilweergave (Myers diff)

Myers voor het berekenen van het verschil voor en na de wijziging. Het maakt gebruik van een diff-algoritme om verwijderingen (rood) en invoegingen (groen) voor elk teken te berekenen en markeert ze.

Feedback sturen

Laat ons uw mening weten om ons te helpen de tool te verbeteren.

Disclaimer

De tools op deze site zijn volledig gratis te gebruiken, maar het gebruik is op eigen risico. Wij bieden geen garanties met betrekking tot de nauwkeurigheid, volledigheid of veiligheid van berekeningsresultaten, conversieresultaten of gegenereerde gegevens. Houd er rekening mee dat de beheerder geen verantwoordelijkheid aanvaardt voor eventuele schade of problemen veroorzaakt door het gebruik van deze tools. Bovendien worden bestandsverwerking en berekeningen lokaal in uw browser uitgevoerd, wat betekent dat de door u ingevoerde gegevens niet naar onze servers worden verzonden of daar worden opgeslagen.