Mojibake-Fixer & Kodierungskonverter
Korrigieren Sie sofort fehlerhaften Text (Mojibake).
Ein browserbasierter Konverter für Textkodierungen.
Anzuzeigender Text
Nachdem Ihr Text korrigiert wurde, probieren Sie diese Tools als Nächstes aus
Über den Mojibake-Fixer
Dieses kostenlose Online-Tool stellt fehlerhaften (Mojibake) Text automatisch wieder her, indem Sie ihn einfach einfügen. Es erkennt automatisch alle Konvertierungsmuster zwischen UTF-8 / Shift_JIS / EUC-JP / ISO-2022-JP und präsentiert das am besten lesbare Ergebnis.
Die gesamte Verarbeitung läuft komplett in Ihrem Browser über JavaScript — Ihre vertraulichen Daten werden niemals an externe Server gesendet. Eine Registrierung oder ein Login sind nicht erforderlich, sodass Sie es völlig anonym und privat nutzen können.
Verwendung
Text eingeben
Fügen Sie fehlerhaften Text in das Eingabebereich ein. Sie können auch Textdateien (.txt, .csv) mit ungültiger Kodierung per Drag & Drop ablegen.
Kandidaten prüfen
Alle Konvertierungsmuster für die Kodierung werden automatisch überprüft und aufgelistet. Suchen Sie nach dem Ergebnis mit dem „Empfohlen“-Abzeichen.
Ergebnis kopieren
Klicken Sie im Block des korrekt wiederhergestellten Ergebnisses auf "Kopieren", um den bereinigten Text in Ihre Zwischenablage zu kopieren.
Glossar
- Mojibake (Zeichensalat)
- Ein Phänomen, bei dem die zum Speichern eines Textes verwendete Zeichenkodierung nicht mit der Kodierung beim Lesen übereinstimmt, was zu unleserlichen Symbolen führt (z. B. „縺ゅ>縺“).
- UTF-8
- Der universelle Standard zur Zeichenkodierung im modernen Web, der fast alle Sprachen weltweit umfasst. Wird häufig verfälscht, wenn er irrtümlicherweise von älterer Software gelesen wird, die veraltete Kodierungen verwendet.
- Shift_JIS
- Eine veraltete Zeichenkodierung, die häufig in früheren japanischen Windows-Systemen genutzt wurde. Das Öffnen japanischen UTF-8-Textes in einer Shift_JIS-Umgebung verurascht sehr spzeifische Mojibake-Muster.
- EUC-JP / ISO-2022-JP
- EUC-JP stammt von älteren Unix-/Linux-Plattformen, während ISO-2022-JP (JIS) früher der strenge Standard für Internet-E-Mails in Japan war. Beide können Dekodierungsfehler verursachen.
- Kodierung / Dekodierung
- A Kodierung transformiert für Menschen lesbaren Text in Byte-Arrays auf Basis eines spezifischen Standards. Dekodierung übersetzt Bytes zurück in Text. Eine Diskrepanz während des Dekodierens verursacht Mojibake.
- Irreversibler Datenverlust
- Wenn Text unleserlich ist, werden Bytes manchmal komplett verworfen oder von alten Datenbanken gegen ein tatsächliches „?“-Symbol ausgetauscht, wodurch eine mathematische Wiederherstellung unmöglich wird.
- Brute-Force-Analyse
- Die Methodik des Tools, alle vielen Kombinationen aus älteren Kodierungen -> modernen Dekodierungsvektoren durchzutesten und die einzige Kombination zu finden, die den lesbaren Text offenbart.
FAQ
- F.Wird mein Text an einen Server gesendet?
- Nein. Die gesamte Verarbeitung erfolgt in Ihrem Browser. Daten werden weder gesendet noch auf einem externen Server gespeichert, was eine sichere Dekodierung beispielsweise vertraulicher geschäftlicher E-Mails ermöglicht.
- F.Kann ich den Mojibake-Fehler in CSV-Dateien beheben?
- Ja. Ziehen Sie die fehlerhafte CSV-Datei per Drag & Drop in das Feld oder wählen Sie sie über die Schaltfläche Datei laden aus. Nachdem Sie sie mit diesem Tool wiederhergestellt haben, speichern Sie sie als UTF-8 mit BOM in einem Texteditor, damit sie in Excel korrekt geöffnet wird.
- F.Warum können einige Texte nicht wiederhergestellt werden?
- Wenn der unleserliche Text in einem destruktiven Format (wie ANSI/Windows-1252) neu gespeichert wurde, gehen fehlerhafte Byte-Informationen dauerhaft verloren. Irreversibles Mojibake kann nicht mathematisch behoben werden, obwohl dieses Tool versucht, Teile davon abzuschätzen.
- F.Was bedeutet ein Muster wie 'UTF-8 → Shift_JIS'?
- Es stellt den 'Fehler' dar, der den Zeichensalat verursacht hat: Das Originaldokument wurde in 'UTF-8' gespeichert, aber die von Ihnen verwendete Software hat es fälschlicherweise geöffnet, in der Annahme, es sei 'Shift_JIS'.
- F.Woher weiß ich, welches der Ausgabeergebnisse das richtige ist?
- Das Tool zeigt Versuche aller gängigen Kodierungskombinationen. Scrollen Sie einfach durch das Ausgabepanel und identifizieren Sie visuell den Block, bei dem die japanischen Zeichen zu einem kohärenten, lesbaren Satz werden.
- F.Kann dies das häufige '縺'-Zeichensalat-Problem beheben?
- Ja. Das Vorkommen von Zeichen wie '縺' ist das Markenzeichen von UTF-8-Text, der fälschlicherweise als Shift_JIS geöffnet wurde. Unser Tool konvertiert dies einfach wieder in korrektes Japanisch.
- F.Kann es Emojis wiederherstellen, die zu Fragezeichen (?) wurden?
- Im Allgemeinen nicht. Wenn die Software keine Emojis unterstützte und die 4-Byte-Zeichen mit einem tatsächlichen '?' oder '□'-Zeichen überschrieben hat, sind die Originaldaten zerstört und können nicht wiederhergestellt werden.
- F.Wie kann ich verhindern, dass Mojibake in meinem Team auftritt?
- Stellen Sie sicher, dass alle Teammitglieder ihre Texteditoren, IDEs, Datenbanken und CSV-Exporteinstellungen so konfigurieren, dass sie den universellen Standard 'UTF-8' verwenden, um Fehler durch Kodierungsinkongruenzen vollständig zu eliminieren.
Anwendungsfälle
Wiederherstellung von E-Mail-Text
Stellen Sie fehlerhaften Text aus E-Mails her, die mit ISO-2022-JP oder Shift_JIS kodiert geliefert wurden.
CSV-Dateireparatur
Korrigieren Sie Mojibake in CSV-Dateien, die in Excel geöffnet wurden, einschließlich UTF-8 BOM-Fehler.
Webdaten-Wiederherstellung
Reparieren Sie durch Kodierungsfehler entstandenen fehlerhaften Text aus Datenbanken oder API-Antworten.
Migration von Altsystemen
Konvertieren Sie unlesbaren Text von alten Systemen in die korrekte UTF-8-Kodierung.
Technische Details
Warum tritt Mojibake auf?
Textdaten werden intern als Byte-Sequenzen gespeichert. Dieselben Bytes ergeben unterschiedliche Zeichen, je nachdem, welche Kodierungsregel zu ihrer Interpretation genutzt wird. Mojibake tritt auf, wenn der Empfänger versucht, Bytes in der Annahme anzuzeigen, es seien "UTF-8", während diese in Wirklichkeit in "Shift_JIS" verfasst wurden.
Häufige Mojibake-Muster
- Fehllesung von UTF-8 → Shift_JIS: Gekennzeichnet durch aufeinanderfolgende Kanji wie "繧" "縺" "繝". Der häufigste Zeichensalat im Internet.
- Fehllesung von Shift_JIS → UTF-8: Enthält meist Steuerzeichen oder Ersetzungszeichen. Häufig in alten CSV-Dateien.
Wie dieses Tool funktioniert & unterstützte Muster
Die gesamte Verarbeitung nutzt die integrierte Browser-API TextDecoder. Sie extrahiert die Codepunkte und versucht dann eine Brute-Force-Dekodierung über alle Kodierungskombinationen, um die richtige Wiederherstellung zu ermitteln.
- Einstufig (19 Muster): Behebt Mojibake, die durch eine einzige falsche Kodierung verursacht wurden (z.B. UTF-8 ↔ SJIS).
- Mehrstufig (10 Muster): Versucht, komplexe, verkettete Mojibake aus mehrfachen falschen Konvertierungen wiederherzustellen (z.B. SJIS→CP1252→UTF-8).