Full-width half-width conversion tool
(Katakana/Alphanumeric)
Batch normalizes
notation variations such as full-width alphanumeric characters, half-width katakana, and full-width spaces.
* De inhoud wordt in uw browser verwerkt — en wordt nooit naar een server gestuurd.
⚙️ Geavanceerde Opties ▼
Verschil Weergave (Myers diff)
Voor
Na
Misschien ook interessant
Over
Dit is een tool die "fluctuaties" zoals alfanumerieke tekens over de volledige breedte, halfbrede katakana en spaties over de volledige breedte in Japanse tekst in één keer normaliseert. Het kan worden gebruikt in een verscheidenheid aan situaties, zoals formulierinvoervoorverwerking, gegevensopschoning en manuscriptcorrectie.
Naast 5 presets (voor formulierinvoer, halfbrede alfanumerieke tekens, volledige breedte kana, allemaal hiragana en allemaal katakana), bevat het ook geavanceerde opties zoals individuele instellingen voor alfanumerieke tekens, symbolen, spaties, kana-breedte en kana-type, regeleinden verenigen, spaties aan het einde van regels verwijderen en tabbladen converteren. U kunt de wijzigingen visueel controleren met de verschilmarkering.
Alle verwerking wordt binnen de browser voltooid en er worden geen gegevens naar een externe server verzonden. Geen lidmaatschapsregistratie of installatie vereist; plak gewoon de tekst en u kunt direct beginnen met normaliseren.
Hoe te gebruiken
Voer tekst in
Plak de tekst die u wilt normaliseren in het invoerveld. Het ondersteunt alle soorten tekst, inclusief formulierinvoer, CSV en manuscripten.
Preset-opties
"Auto-update" AAN om geavanceerde opties aan te passen of een preset te kiezen.
Resultaat kopiëren
Controleer, kopieer en sla de genormaliseerde tekst en de differentiaalmarkeringresultaten op.
Woordenlijst
- Halfbreedte naar Volledige breedte Kana
- Converteert oude halfbrede Japanse katakana ("アイウエオ") naar standaard katakana van volledige breedte ("アイウエオ"). Essentieel voor de leesbaarheid op het moderne web.
- Volledige breedte naar Halfbreedte Alfanumeriek
- Converteert brede Engelse letters en cijfers ("123ABC") naar het standaard ASCII halfbreedte formaat ("123ABC"). Kritisch voor database validatie.
- Unicode Normalisatie (NFC/NFD)
- Het proces van het verenigen van verschillende interne byterecreaties van hetzelfde teken. Bijvoorbeeld door ervoor te zorgen dat "が" een enkel teken is in plaats van "か" + "゛".
- Machineafhankelijke Tekens
- Oude propriëtaire glyphs (zoals omcirkelde nummers of specifieke Romeinse cijfers) die mojibake (vervormde tekst) veroorzaken op moderne systemen. Het beste is om ze weg te normaliseren.
- Orthografische Variantie
- Inconsistenties in de tekst, zoals meerdere manieren om "appel" in het Japans te schrijven (りんご, リンゴ, 林檎). Normalisatie helpt zoekmachines om tekst nauwkeurig te indexeren.
- Spaties Bijsnijden
- Het verwijderen of standaardiseren van spaties. Dit omvat het converteren van brede Japanse spaties naar standaard ASCII-spaties, het weglaten van spaties aan het einde van een regel en het samenvoegen van meerdere spaties.
- Reguliere Expressie Verwerking
- De onderliggende technologie (Reguliere Expressies) die door de tool wordt gebruikt om miljoenen tekenpatronen direct in uw browser te lokaliseren en te verwisselen.
FAQ
- Q.I want to convert full-width alphanumeric characters to half-width. Which preset should I choose?
- Please select the 'Alphanumeric characters → half-width only' preset. Only alphanumeric characters and symbols are converted to half-width, and katakana and hiragana are kept as is.
- Q.I want to convert half-width katakana to full-width
- Please select the 'half-width kana → full-width kana only' preset. Half-width kana with voiced and half-voiced marks are also correctly combined into one full-width character.
- Q.Can you convert katakana to hiragana?
- Yes. You can convert all files at once using the preset 'All Hiragana'. It can also be set individually in 'Kana type' in the advanced options.
- Q.Is my text data secure?
- Completely secure. All text processing and regex operations are executed in real-time within your web browser. Nothing is ever sent to or processed by external servers.
- Q.Can I paste columns directly from Excel/Google Sheets?
- Yes. You can copy a whole column of messy customer data, paste it in, normalize the alphanumeric characters, and paste it directly back into your spreadsheet cleanly.
- Q.Can I disable the conversion of full-width spaces?
- Yes. You have granular control via the settings panel. Simply uncheck the associated box if you wish to preserve Japanese full-width spaces.
- Q.Will it fix separated dakuten marks like 'か' + '゙'?
- Yes. The tool automatically detects separated dakuten (voiced marks) and intelligently merges them back into single, standardized characters (e.g., 'が').
- Q.What are typical use cases for this normalizer?
- Invaluable for data cleansing form submissions, migrating legacy databases, sanitizing e-commerce product catalogs, and standardizing formatting before sending to printing presses.
- Q.Does it process line breaks properly?
- Yes. It preserves your existing line breaks (or standardizes them to LF/CRLF depending on settings) while processing the text on a line-by-line basis without merging paragraphs.
- Q.Is there a limit to how much text I can process?
- Because it uses highly optimized local JavaScript, it can comfortably handle tens of thousands of characters in milliseconds without freezing the browser.
Gebruiksscenario's
Voorverwerking formulierinvoer
Ideaal voor validatiestappen voordat ze in de database worden opgeslagen.
CSV opschoning
Verbeterde aggregatienauwkeurigheid door het mengsel van volledige breedte en halfbreedte tekens en inconsistente spatiëring te elimineren.
Proeflezen van manuscripten en artikelen
Verschilweergave stelt u in staat wijzigingen visueel te bevestigen, wat de efficiëntie van proeflezen aanzienlijk verbetert.
Voorverwerking van programma's
Pas tekens van volledige breedte en halfbreedte uniform aan voordat u gebruikersinvoer verwerkt.
Technisch
Tekencode conversiemechanisme
Volledige breedte ↔ halfbreedte conversie wordt geïmplementeerd door offset-berekening van Unicode-codepunten. Het verschil tussen alfanumerieke tekens met volledige breedte en halfbreedte tekens is vastgezet op 0xFEE0, dus ze kunnen snel worden geconverteerd door gewoon op te tellen en af te trekken.
Kana conversie algoritme
Unicode-normalisatie (NFKC) wordt gebruikt om van halfbrede kana naar volledige breedte kana te converteren. Halfbrede kana met stemhebbende markeringen (bijv. ga) is twee tekens, maar NKFC combineert het tot één teken van volledige breedte (ga).
Verschilweergave (Myers diff)
Myers voor het berekenen van het verschil voor en na de wijziging. Het maakt gebruik van een diff-algoritme om verwijderingen (rood) en invoegingen (groen) voor elk teken te berekenen en markeert ze.
Feedback sturen
Laat ons uw mening weten om ons te helpen de tool te verbeteren.
Feedback wordt tijdelijk opgeschort
De server is overbelast of spambeveiliging is actief. Probeer het later opnieuw.