Perbaiki Mojibake & Konverter Encoding
Perbaiki teks rusak (Mojibake) secara instan.
Konverter encoding teks berbasis browser.
Teks yang Akan Dipulihkan
Setelah teks Anda diperbaiki, coba alat ini selanjutnya
Ikhtisar Alat Perbaikan Mojibake
Alat online gratis ini memulihkan teks rusak (Mojibake) secara otomatis hanya dengan menempelkannya. Baik Anda menerima karakter acak dari transfer file antara Windows dan Mac, maupun mengekstrak data yang rusak dari sistem lama, alat ini menyelesaikan masalah encoding teks secara instan.
Alat ini mendeteksi otomatis dan menguji semua pola konversi antara UTF-8, Shift_JIS (SJIS / CP932), EUC-JP, dan ISO-2022-JP, lalu menyajikan hasil yang paling alami dan koheren — menghemat kerumitan menebak encoding karakter mana yang digunakan secara manual.
Semua pemrosesan pemulihan berjalan sepenuhnya di dalam browser Anda. Data sensitif Anda, termasuk dokumen rahasia dan informasi pelanggan, tidak pernah dikirim ke atau disimpan di server eksternal mana pun. Tidak diperlukan instalasi perangkat lunak, pembuatan akun, atau login — menjadikannya aman dan privat untuk penggunaan bisnis sehari-hari.
Mengapa Mojibake Terjadi? Penjelasan Penyebab Umum
Ketidakcocokan Encoding Karakter Adalah Akar Masalahnya
Di komputer, semua data teks disimpan sebagai urutan angka (byte — nol dan satu). Buku aturan yang memetakan angka-angka ini ke karakter yang dapat dibaca manusia disebut "character encoding" (seperti UTF-8 atau Shift_JIS).
Misalnya, karakter Jepang "あ" yang sama direpresentasikan oleh nilai byte yang berbeda di UTF-8 dan Shift_JIS. Jika pengirim menyimpan file menggunakan Shift_JIS, tetapi perangkat lunak penerima keliru membukanya sebagai UTF-8, byte ditafsirkan dengan buku aturan yang salah — dan layar menampilkan karakter sampah. Inilah yang disebut Mojibake.
Pola Mojibake yang Umum
- UTF-8 salah dibaca sebagai Shift_JIS:
Jenis mojibake paling umum di web. Anda akan melihat kanji asing seperti "繧", "縺", dan "繝" muncul dalam rangkaian panjang yang tidak masuk akal. Ini sering terjadi saat file yang dibuat di Mac dibuka dengan perangkat lunak Windows yang lebih lama. - Shift_JIS salah dibaca sebagai UTF-8:
Sebagian besar karakter diganti dengan "�" (berlian hitam dengan tanda tanya) atau tanda "?" literal. Jika teks disimpan setelah penggantian ini terjadi, data byte asli hilang secara permanen dan pemulihan penuh tidak mungkin dilakukan.
Cara Memperbaiki Mojibake — Panduan Langkah demi Langkah
Tempel Teks Rusak
Tempel teks acak yang ingin Anda dekode ke area input di atas. Anda juga bisa menyeret & menjatuhkan file teks (.txt, .csv) dengan encoding yang rusak langsung ke alat ini.
Pilih Hasil yang Benar
Puluhan pola konversi encoding secara otomatis diuji di latar belakang. Telusuri hasilnya dan cari yang berlencana "★ Direkomendasikan" — menunjukkan teks Jepang yang paling dapat dibaca secara alami.
Salin atau Coba Konversi Manual
Klik tombol "Salin" pada hasil yang dipulihkan dengan benar untuk menyimpan teks bersih ke clipboard Anda. Jika deteksi otomatis tidak menghasilkan hasil yang tepat, gunakan panel "Konversi Encoding Manual" untuk menentukan pasangan encoding yang tepat secara manual.
Glosarium Mojibake dan Encoding
- Mojibake (Teks Acak)
- Fenomena kesalahan di mana encoding karakter yang digunakan untuk membuat dan menyimpan file teks tidak cocok dengan encoding yang digunakan untuk membuka dan membacanya, sehingga karakter ditampilkan sebagai simbol acak yang tidak masuk akal (mis., "縺ゅ>縺"). Alat konversi kode karakter diperlukan untuk memulihkan encoding yang benar.
- UTF-8 (Unicode Transformation Format)
- Standar encoding karakter yang paling banyak diadopsi di internet modern dan sistem operasi (varian dari Unicode). Mampu menangani karakter dari hampir semua bahasa secara bersamaan, tetapi sering salah dibaca sebagai Shift_JIS oleh perangkat lunak Windows yang lebih lama, menyebabkan mojibake.
- Shift_JIS (SJIS / CP932)
- Encoding karakter warisan khusus untuk bahasa Jepang, banyak digunakan di lingkungan Windows OS yang lebih lama. Membuka teks UTF-8 modern di aplikasi yang hanya mendukung Shift_JIS (seperti versi lama Excel) menghasilkan pola mojibake "縺" yang khas.
- EUC-JP / ISO-2022-JP
- EUC-JP umum digunakan di server Linux dan Unix yang lebih lama. ISO-2022-JP (juga dikenal sebagai encoding JIS) adalah standar untuk komunikasi email Jepang awal. Keduanya tetap menjadi sumber mojibake saat berinteraksi dengan sistem modern.
- Encode
- Proses mengubah teks yang dapat dibaca manusia menjadi urutan byte (data digital) menurut standar encoding karakter tertentu seperti UTF-8 atau Shift_JIS, agar komputer dapat menyimpan dan memprosesnya.
- Decode
- Proses sebaliknya: mengubah data byte kembali menjadi teks yang dapat dibaca manusia menurut buku aturan encoding karakter. Ketika buku aturan yang salah diterapkan selama decoding, mojibake muncul di layar.
Pertanyaan yang Sering Diajukan tentang Mojibake
- Q.Apakah teks saya dikirim ke server?
- Tidak. Semua pemrosesan terjadi sepenuhnya di browser Anda. Data tidak pernah dikirim atau disimpan di server eksternal mana pun, sehingga aman untuk mendekode email kerja rahasia.
- Q.Bisakah saya memperbaiki mojibake file CSV?
- Ya. Seret & lepas file CSV yang rusak atau pilih melalui tombol Muat File. Setelah dipulihkan, simpan sebagai UTF-8 with BOM di editor teks agar terbuka dengan benar di Excel.
- Q.Mengapa beberapa teks gagal dipulihkan?
- Jika teks yang rusak disimpan ulang dalam format yang merusak (seperti ANSI/Windows-1252), informasi byte yang hilang hilang secara permanen. Mojibake yang tidak dapat dibalik tidak dapat diperbaiki secara matematis.
- Q.Apa arti pola seperti 'UTF-8 → Shift_JIS'?
- Ini mewakili 'kesalahan' yang menyebabkan teks rusak: Dokumen asli disimpan dalam 'UTF-8', tetapi perangkat lunak yang digunakan keliru membukanya dengan asumsi 'Shift_JIS'.
- Q.Bagaimana cara mengetahui hasil output yang benar?
- Alat menampilkan hasil dari semua kombinasi encoding umum. Gulir panel output dan identifikasi secara visual blok di mana karakter menjadi kalimat yang koheren.
- Q.Bisakah ini memperbaiki masalah '縺' yang umum?
- Ya. Karakter seperti '縺' adalah ciri khas teks UTF-8 yang dibuka sebagai Shift_JIS. Alat kami mudah menerjemahkan ini kembali ke teks yang benar.
- Q.Bisakah memulihkan emoji yang berubah menjadi tanda tanya (?)
- Umumnya tidak. Jika perangkat lunak tidak mendukung emoji dan menimpa karakter 4-byte dengan '?' atau '□', data asli hancur dan tidak dapat dipulihkan.
- Q.Bagaimana cara mencegah Mojibake terjadi pada tim saya?
- Pastikan semua anggota tim mengatur editor teks, IDE, database, dan pengaturan ekspor CSV untuk menggunakan standar universal 'UTF-8' agar menghilangkan ketidakcocokan encoding.
Kasus Umum Mojibake dan Solusinya
Berikut adalah situasi paling umum di mana mojibake terjadi, beserta solusi praktisnya.
File CSV Acak Saat Dibuka di Excel
Saat Anda membuka file CSV ber-encoding UTF-8 (misalnya, diekspor dari aplikasi web) dengan mengklik dua kali di Windows Excel, Excel mungkin mencoba membacanya sebagai Shift_JIS, menyebabkan mojibake.
Solusi: Jatuhkan file ke alat ini untuk memulihkannya, atau gunakan tab "Data" Excel → wizard impor "Dari Teks/CSV" dan tentukan UTF-8 sebagai encoding asal file.
Email yang Diterima Tidak Bisa Dibaca
Ini terjadi ketika klien email pengirim menggunakan encoding lama seperti ISO-2022-JP atau EUC-JP, tetapi klien email penerima (Outlook, Gmail, dll.) mencoba memprosesnya sebagai UTF-8.
Solusi: Salin seluruh isi email yang rusak dan tempel ke area input alat ini untuk mendekode dan memulihkan pesan aslinya.
Nama File ZIP Acak Antara Mac & Windows
Saat file ZIP yang dibuat di Mac diekstrak di Windows menggunakan ekstraktor bawaan, nama file mungkin menjadi acak. Ini karena Mac menyimpan nama file dalam UTF-8, sementara Windows mencoba menafsirkannya sebagai Shift_JIS.
Solusi: Gunakan alat ekstraksi yang mendukung UTF-8 seperti 7-Zip, atau gunakan utilitas kompresi yang kompatibel dengan Windows di sisi Mac.
Seluruh Situs Web Tampil Acak di Browser
Ini terjadi ketika meta tag file HTML (deklarasi charset) tidak sesuai dengan encoding aktual yang digunakan untuk menyimpan file tersebut.
Solusi: Gunakan ekstensi browser untuk mengubah encoding teks secara manual, atau administrator situs perlu memperbaiki deklarasi charset dalam HTML.
Cara Kerja Algoritma Pemulihan Mojibake (Detail Teknis)
Pemrosesan Aman Berbasis Browser via TextDecoder API
Untuk memulihkan mojibake, alat ini memanfaatkan API TextEncoder dan TextDecoder yang tersedia di browser modern. Alat ini mengekstrak code point dari teks input yang rusak dan melakukan konversi byte serta decoding ulang di semua encoding yang didukung — sepenuhnya di sisi klien.
Ini berarti tidak ada data yang pernah dikirim ke server eksternal, menjadikan proses perbaikan sangat aman dan cepat.
Deteksi Otomatis Brute-Force & Penilaian
Untuk setiap input, alat ini menjalankan puluhan uji konversi secara asinkron di latar belakang:
- Konversi satu tahap (19 pola): Mencakup semua mojibake umum yang disebabkan oleh satu kesalahan interpretasi encoding (mis., data yang sebenarnya UTF-8 tetapi dibuka sebagai Shift_JIS).
- Multi-tahap / mojibake ganda (10 pola): Menangani kasus kompleks di mana data melewati beberapa sistem dan disalahkonversi dua kali atau lebih (mis., kerusakan berantai SJIS → CP1252 → UTF-8).
Setiap hasil dinilai menggunakan algoritma khusus yang mengevaluasi frekuensi karakter Jepang (hiragana, katakana, kanji umum), rasio karakter ASCII, dan prevalensi karakter pengganti yang rusak (? atau �). Hasil dengan skor tertinggi — dianggap sebagai "bahasa Jepang paling alami" — mendapat lencana "★ Direkomendasikan".
Kirim Umpan Balik
Beri tahu kami pendapat Anda untuk membantu kami menyempurnakan alat ini.
Umpan balik sementara ditangguhkan
Server sedang sibuk atau perlindungan spam aktif. Silakan coba lagi nanti.