Mac Dakuten-Trennung beheben
(Unicode-Normalisierung)
Behebt Mac-spezifische Dateinamen-Trennungen sofort
in Ihrem Browser.
🔍 Detaillierte Analyse (Codepoints)
Über
Ein Online-Tool, das Unicode-Textnormalisierung (NFC/NFD/NFKC/NFKD) in Echtzeit durchführt. Sie können problemlos die erforderliche Normalisierungsverarbeitung durchführen, um Zeichencodes zu vereinheitlichen und zu vergleichen.
Unterstützt Normalisierungsmuster, die in der Textverarbeitung häufig vorkommen, wie z. B. die Vereinheitlichung von Zeichen mit voller und halber Breite, das Kombinieren/Trennen von stimmhaften Markierungen (Dakuten) und die Normalisierung kompatibler Zeichen. Es ist auch möglich, Zeichen-Codepoints und Zeichenfolgen (Bytes) anzuzeigen.
Die gesamte Verarbeitung erfolgt lokal im Browser und es werden keine Daten an den Server gesendet.
Anleitung
Text eingeben
Geben Sie den zu normalisierenden Text in das Eingabefeld ein oder fügen Sie ihn ein.
Format auswählen
Wählen Sie das Normalisierungsformat: NFC, NFD, NFKC oder NFKD.
Ergebnis prüfen/kopieren
Überprüfen Sie den Text und die Änderungen der Codepoints nach der Normalisierung und kopieren Sie das Ergebnis.
Glossar
- Unicode-Standard
- Der universelle IT-Standard für die einheitliche Codierung, Darstellung und Handhabung von Texten, der sicherstellt, dass Zeichen weltweit gleich aussehen.
- Zeichenfolgen-Normalisierung
- Der kritische Prozess zur Konvertierung von Strings, die optisch identisch, aber grundlegend unterschiedlich codiert sind, in eine einheitliche, vorhersehbare Binärsequenz.
- Kombinierende Zeichen / Diakritika
- Typografische Situationen, in denen ein Basisbuchstabe (z. B. "a") mathematisch mit einem separaten Akzentzeichen (z. B. "´") kombiniert wird, um optisch wie ein einziger Buchstabe ("á") zu wirken.
- NFD (Kanonische Zerlegung)
- Ein Normalisierungsmodus, der zusammengesetzte Zeichen in ihre kleinsten individuellen Basisbuchstaben plus kombinierende Zeichen zerlegt (z. B. "ñ" in "n" und "~"). Standard in macOS-Dateisystemen.
- NFC (Kanonische Komposition)
- Der am weitesten verbreitete Internetstandard. Er kombiniert Basiszeichen und deren Akzentzeichen zu einem einzigen, zusammengesetzten Zeichen (z. B. "n" + "~" wird zu "ñ").
- NFKC (Kompatibilitäts-Komposition)
- Ein sehr strenger Normalisierungsfilter. Er führt nicht nur kombinierende Zeichen zusammen, sondern wandelt auch formelle Abweichungen um – z. B. hochgestellte Zeichen ("²") in normale Zahlen ("2") oder Zeichen voller Breite in solche mit halber Breite.
FAQ
- Q.Warum ist Unicode-Normalisierung in der Softwareentwicklung unverzichtbar?
- Wenn ein Benutzer auf einem Linux-System "ñ" und ein anderer auf einem Mac "ñ" eingibt, könnte die unsichtbare Byte-Zusammensetzung völlig unterschiedlich sein. Eine Datenbanksuche nach "ñ" würde eventuell eines der Ergebnisse übersehen, wenn die Daten nicht vorher auf NFC normalisiert wurden.
- Q.Welchen der vier Modi sollte ich auswählen?
- Wenn keine systemspezifischen Ausnahmen existieren, sollten Sie "NFC" verwenden. Das W3C empfiehlt NFC als den Standard für alle Internetprotokolle und HTML-Dokumente.
- Q.Warum sieht japanischer/französischer Text, der von einem Mac kopiert wird, auf Windows manchmal merkwürdig aus?
- macOS erzwingt für Dateinamen oft das NFD-Format, bei dem diakritische Zeichen (oder Dakuten im Japanischen) von ihren Basisbuchstaben getrennt werden. Unser Tool repariert dies sofort durch die NFC-Komposition.
- Q.Werden sensible Daten von mir beim Einfügen an Server übertragen?
- Nein. Es verlassen niemals Daten Ihren Browser. Alle Konvertierungen nutzen das JavaScript
String.normalize()— es erfolgen keinerlei Netzwerkanfragen. - Q.Warum schwankt die Zeichenanzahl nach der Normalisierung gelegentlich?
- Wenn das Tool getrennte Komponenten (Isolierte Basis + Isoliertes Akzentzeichen) in ein einziges Zeichen (NFC) komprimiert, sinkt logischerweise die Zeichenanzahl. Umgekehrt kann NFKC ein einzelnes Ligatur-Zeichen ("fi") in zwei separate Zeichen aufteilen.
Anwendungsfälle
Datenbankvereinheitlichung
Stellen Sie Dateneinheitlichkeit sicher, indem Sie Benutzereingaben normalisieren, bevor Sie sie speichern.
Zeichenfolgenvergleich
Erreichen Sie präzise Vergleiche und Suchergebnisse durch normalisierte Textstrukturen.
Text-Vorverarbeitung
Wenden Sie Normalisierung als Vorverarbeitung für NLP (Natural Language Processing) an.
Zeichencode-Untersuchungen
Überprüfen Sie Codepoints von fehlerhaften Textbestandteilen (z. B. Mac-Dakuten).
Technik
String.prototype.normalize() API
Da nur browser-native Funktionen verwendet werden, können selbst sehr große String-Daten in wenigen Millisekunden und ohne Netzwerkanfragen normalisiert werden.