Vollbreiten-Halbbreiten-Konverter
(Katakana/Alphanumerisch)
Normalisiert stapelweise
Notationsvariationen wie vollbreite alphanumerische Zeichen, halbbreite Katakana und vollbreite Leerzeichen.
* Inhalt wird in Ihrem Browser verarbeitet – niemals an einen Server gesendet.
⚙️ Erweiterte Optionen ▼
Diff-Ansicht (Myers Diff)
Vorher
Nachher
Über
Dies ist ein Tool, das Variationen wie vollbreite alphanumerische Zeichen, halbbreite Katakana und vollbreite Leerzeichen in japanischem Text auf einmal normalisiert. Es kann in vielen Situationen verwendet werden, wie z.B. bei der Vorverarbeitung von Formulareingaben, der Datenbereinigung und dem Korrekturlesen von Manuskripten.
Zusätzlich zu 5 Voreinstellungen (für Formulareingaben, halbbreite alphanumerische Zeichen, vollbreite Kana, komplett in Hiragana und komplett in Katakana) enthält es erweiterte Optionen für individuelle Einstellungen von alphanumerischen Zeichen, Symbolen, Leerzeichen, Kana-Breite und Kana-Typ, Vereinheitlichung von Zeilenumbrüchen und Löschung von Leerzeichen am Zeilenende sowie Tabulatorkonvertierung. Sie können Änderungen mit der Differenzanzeige visuell überprüfen.
Alle Verarbeitungen erfolgen sicher in Ihrem Browser, ohne dass Daten an externe Server gesendet werden. Keine Registrierung oder Installation erforderlich – einfach Text einfügen und sofort normalisieren.
Verwendung
Text eingeben
Fügen Sie den Text, den Sie normalisieren möchten, in das Eingabefeld ein. Es werden alle Texttypen wie Formulareingaben, CSV und Manuskripte unterstützt.
Einstellungen wählen
Aktivieren Sie "Auto-Aktualisierung", um erweiterte Optionen anzupassen, oder wählen Sie eine Voreinstellung.
Ergebnis speichern
Überprüfen, kopieren und speichern Sie den normalisierten Text und die resultierenden Differenzhervorhebungen.
Glossar
- Halbbreite zu Vollbreite Kana
- Konvertiert ältere halbbreite japanische Katakana ("アイウエオ") in standardmäßige vollbreite Katakana ("アイウエオ"). Wesentlich für die moderne Web-Lesbarkeit.
- Vollbreite zu Halbbreite Alphanumerisch
- Konvertiert breite englische Buchstaben und Zahlen ("123ABC") in das Standard-ASCII-Halbbreitenformat ("123ABC"). Sehr wichtig für die Datenbankvalidierung.
- Unicode-Normalisierung (NFC/NFD)
- Der Prozess der Vereinheitlichung verschiedener interner Byte-Darstellungen desselben Zeichens. Zum Beispiel um sicherzustellen, dass "が" ein einzelnes Zeichen ist und nicht "か" + "゛".
- Maschinenabhängige Zeichen
- Alte proprietäre Glyphen (wie eingekreiste Zahlen oder bestimmte römische Ziffern), die auf modernen Systemen Mojibake (verschlüsselten Text) verursachen. Es ist am besten, sie zu normalisieren.
- Orthographische Varianz
- Inkonsistenzen im Text, wie z.B. mehrere Möglichkeiten, "Apfel" im Japanischen zu schreiben (りんご, リンゴ, 林檎). Normalisierung hilft Suchmaschinen, den Text genau zu indizieren.
- Leerzeichen reduzieren
- Das Entfernen oder Standardisieren von Leerzeichen. Es umfasst die Umwandlung japanischer breiter Leerzeichen in Standard-ASCII-Leerzeichen, das Entfernen von Leerzeichen am Zeilenende und das Zusammenfassen mehrerer Leerzeichen.
- Regex-Verarbeitung
- Die zugrunde liegende Technologie (reguläre Ausdrücke), die vom Tool verwendet wird, um Millionen von Zeichenmustern sofort in Ihrem Browser zu finden und zu ersetzen.
FAQ
- F.Ich möchte vollbreite alphanumerische Zeichen in halbbreite umwandeln. Welche Voreinstellung soll ich verwenden?
- Bitte wählen Sie die Voreinstellung 'Alphanumerisch→nur Halbbreite'. Nur alphanumerische Zeichen und Symbole werden in Halbbreite umgewandelt; Katakana und Hiragana bleiben unverändert.
- F.Ich möchte halbbreite Katakana in vollbreite umwandeln
- Bitte wählen Sie die Voreinstellung 'Halbbreite Kana→nur Vollbreite Kana'. Halbbreite Kana mit stimmhaften Zeichen werden ebenfalls korrekt zu einem vollbreiten Zeichen kombiniert.
- F.Können Sie Katakana in Hiragana umwandeln?
- Ja. Sie können alles auf einmal mit der Voreinstellung 'Alles in Hiragana umwandeln' konvertieren. Es kann auch manuell in den erweiterten Optionen unter 'Kana-Typ' eingestellt werden.
- F.Sind meine Textdaten sicher?
- Absolut sicher. Alle Textverarbeitungs- und Regex-Vorgänge werden in Echtzeit in Ihrem Webbrowser ausgeführt. Es wird nichts an externe Server gesendet oder von diesen verarbeitet.
- F.Kann ich Spalten direkt aus Excel/Google Sheets einfügen?
- Ja. Sie können eine ganze Spalte mit unordentlichen Kundendaten kopieren, sie einfügen, normalisieren und direkt wieder sauber in Ihre Tabelle einfügen.
- F.Kann ich die Konvertierung von vollbreiten Leerzeichen deaktivieren?
- Ja. Sie haben die volle Kontrolle über das Einstellungsfeld. Deaktivieren Sie einfach das entsprechende Kontrollkästchen, wenn Sie das japanische vollbreite Leerzeichen beibehalten möchten.
- F.Werden abgetrennte Dakuten-Markierungen wie 'か' + '゙' korrigiert?
- Ja. Das Tool erkennt diese fehlerhaften stimmhaften Zeichen und führt sie intelligent wieder zu einzelnen, standardisierten Zeichen zusammen (z.B. 'が').
- F.Was sind typische Anwendungsfälle für diesen Normalisierer?
- Unentbehrlich für die Datenbereinigung von Formulareingaben, die Migration bestehender Datenbanken und die Vorbereitung von Texten für den Druck.
- F.Werden Zeilenumbrüche richtig verarbeitet?
- Ja. Vorhandene Zeilenumbrüche bleiben erhalten (oder werden je nach Einstellung auf LF/CRLF standardisiert), da die Verarbeitung für jede Zeile separat durchgeführt wird.
- F.Wie viel Text kann ich auf einmal verarbeiten?
- Dank hochgradig optimiertem lokalem JavaScript können Sie bequem Zehntausende von Zeichen in Millisekunden verarbeiten, ohne dass der Browser einfriert.
Anwendungsfälle
Vorverarbeitung von Formulareingaben
Ideal für Validierungsschritte vor der Speicherung in der Datenbank.
CSV-Bereinigung
Verbesserte Genauigkeit bei der Aggregation durch Eliminierung von Mischungen aus voll- und halbbreiten Zeichen sowie inkonsistenten Abständen.
Korrekturlesen von Manuskripten
Die Differenzanzeige ermöglicht es Ihnen, Änderungen visuell zu bestätigen, was die Effizienz der Korrektur erheblich verbessert.
Programmvorverarbeitung
Gleichen Sie voll- und halbbreite Zeichen einheitlich an, bevor Sie Benutzereingaben verarbeiten.
Technik
Zeichencode-Konvertierungsmechanismus
Die Konvertierung zwischen Vollbreite ↔ Halbbreite erfolgt durch Offset-Berechnung von Unicode-Codepunkten. Der Unterschied zwischen vollbreiten alphanumerischen Zeichen und halbbreiten Zeichen ist fixiert auf 0xFEE0, so dass sie durch einfaches Addieren und Subtrahieren schnell konvertiert werden können.
Kana-Konvertierungsalgorithmus
Die Unicode-Normalisierung (NFKC) wird verwendet, um halbbreite Kana in vollbreite Kana zu konvertieren. Halbbreites Kana mit stimmhaften Zeichen (z.B. ga) besteht aus zwei Zeichen, aber NKFC kombiniert es zu einem vollbreiten Zeichen (ga).
Differenzanzeige (Myers diff)
Verwendet den Myers Diff-Algorithmus zur Berechnung der Differenz vor und nach der Änderung. Er berechnet Löschungen (rot) und Einfügungen (grün) für jedes Zeichen und hebt sie hervor.