Mojibake Karakter & Şifre Çözücü
Anlamsız sembollere boğulan (Mojibake) e-posta metinlerini arındırın.
Yerel tarayıcı tabanlı güvenilir UTF kod tamircisi.
Kurtarılacak Metin (Hatalı)
Şifrenizi kırdığınıza göre, bu operasyonlara da göz atmaya var mısınız?
Mojibake (Hataya Düşen Kodlama) Tamircisi Nedir?
Bu tamamen ücretsiz çevrimiçi enstrüman sadece hatalı kelimeleri kopyala-yapıştır yapmanız koşuluyla (Mojibake bozulmasını) otomatik restore eder. EUC-JP / Shift-Jis / UTF-8 gibi tüm arayüz çatışmalarını en pürüzsüz ihtimalden zayıfa sıralar.
Tüm algoritmaların beyni tarayıcı (Browser) ekranına mahsustur. Hassas veri şirket dedikoduları asla Dış sunucu (Server) makinesine basılmaz. Tümüyle gizli, limit algısı bulunmayan bir analiz paneli sunuyoruz.
Nasıl Kurtarılır?
Hatalı Gövdeyi Girme
İşlem (Kopyalama) alanına çöplüğe dönmüş kelimeleri taşıyın ya da bozulmuş olan (.txt, .csv) türevli metin dosyalarını çekip bırakıverin.
Olasılıkları Denetleme
Sistem her türlü kod dizilimi ihtimalini yazar / hesaplar. En çok oyu alan (Tavsiye Edilen) pulunu arayıp ona yönelin.
Pano Püskürtmesi (Çıktıyı Alma)
Son derece muntazam bulduğunuz blok metnini köşesinde duran (Kopyala) ikonuyla belleğinize / panonuza kazandırın.
Sözlük
- Mojibake (Karma / Anlamsız Sürüler)
- Bir karakter kodlaması mimarisiyle doğan varlığın, kendisine zıt/yabancı kodlamaya sahip olan ortamda sergilenme telaşesi nedeniyle şifresinin şaşması ("縺ゅ>縺").
- UTF-8 Standartı
- Günümüz modern web algısının kurucu unsuru. Aslen bu global standart formatı, eski antik yazılımlarla açmaya kalkıştığınızda sözde garip Çince ve Japonca yazılarla (kriz) karşı karşıya dökülürsünüz.
- Shift_JIS Standardı
- Eski dönem Japonya Windows makinelerinin yoğun olarak empoze ettiği atalık bir yazılım kodlaması. Bu tarz dokümanları modern ekranda deşince tipik bozuklar çuvallar.
- EUC-JP ile ISO Standardı
- EUC-JP menşei unix ve linux portallarıyken ISO-2022 formatı oldukça kadim (eski) çağların mail kütüphanelerinden fırlamadır. İkisi de sık problem doğururlar.
- Şifreleme Süreçleri
- Sizin klavyeye bastığınız alfabe dili, belli kodlamalarla yeraltında bayt denilen makine tuğlasına çimentolanır (Encoding). O makine tuğlasının gerisin geriye kelimeye çevrilmesine şifre kırma (Decoding) denir.
- Geri Alınamaz Kriz
- Zaman zaman bazı harfler veritabanı veya antik mail sistemlerince düpedüz anlaşılamayıp doğrudan soru işaretlerine (Sanki klavye ile kasıtla yazılmışçasına) damgalanır. O esnada makine bayt tuğlası kırıldığı için tamir yokuşu kapanmıştır.
- Kaba Kuvvet (Brute Force) İşlemi
- Ekranda görülen tamircimizin çalışma metodudur. Akla gelebilecek tüm makine - insan dil kodlamalarını seri fişek halinde taranıp size içlerinden iyi olanının atılması operasyonudur.
SSS
- Q.Masaüstü metnim ya da verilerim bir sunucuya gidiyor mu?
- Hayır. Bütün karakter analiz ve geri döndürme işlemleri telefon / bilgisayarınızdaki geçici hafızada (Local) kalır. Sunucuya fişlenmediğinden şirket maillerinize yönelik kod kırmak gayet güvenlidir.
- Q.Bozuk gelen bir excel veya CSV dosyasının karakterlerini de yama yapabilir miyim?
- Evet, metin formatını (CSV) Dosya Seç tuşuyla içeri çektikten sonra ekranda temizleyebilirsiniz. Fakat düzgün veriyi bilgisayarınıza aldıktan sonra mutlaka Not Defteri tarzı bir yere kopyalayıp, Farklı Kaydet üzerinden 'UTF-8 BOM' kodlamasıyla Excel'e yedirmeniz lazımdır.
- Q.Bazen neden hiçbir algoritmanız %100 orijinal kaynağı bulamıyor?
- Eğer sorunlu kelimeler çok eskide kalıp, o hatalı haliyle üst üste Windows-1252 gibi yıkıcı bir ANSI ile ezildiyse (kaydedildiyse) asıl veriler uçmuştur. Geri alamayız. Biz ancak tahminde bulunuruz.
- Q.'UTF-8 -> Shift_JIS' arızası ne anlama gelmektedir?
- Bozulmanın ardında yatan mimari sorunu temsil eder: Özgün belge aslında 'UTF-8' şemasında arşivlenmişken, onu okuyan mail ya da editor sistematiğiniz hataya düşüp 'Bana Shift_JIS yolladılar' zannetmiş demektir.
- Q.Listenin alt alta sıraladığı varyasyonlardan hangisine güveneceğim?
- Alet genelde saniyeler içinde olası her kombinasyonu patlatarak alt alta dizdiği için, anlamı tam oturan ve gözünüze ahenkli Japonca / İngilizce bir paragraf gibi görüneni seçmek en mantıklı yöntemdir.
- Q.Sık rastlanan o meşhur '縺' karakter hatasını çözer mi?
- Evet! Web evreninde o can sıkıcı '縺' hatası dediğimiz şey zaten bir evrensel UTF-8 belgesinin ilkel bir sistemle açılıp çökertilmesidir ve anında düzeltilebilir.
- Q.Metin içindeki Emojilerin yerine (?) soru işareti konulup yollanan veriyi emojisine döndürür mü?
- Genel anlamda hayır! Gönderici sistemi emoijyi anlamayıp gerçek anlamda 4-bayt sökününe fiili (?) yahut (□) amblemi bastıysa, o veri ebediyen (?) olarak kazınmış olur. Eski bayt uçar.
- Q.Kurum veya ekip ortamımda garip bozuk sembollerin yaşanmaması için ne tür önlemler alalım?
- Tüm takım arkadaşlarınızın kullandıkları SQL tabanları, Yazılım kodlama portalları (IDE) veya Mail panellerin standart 'UTF-8' ayarına mıhlanmış olduğuna ve CSV dışarı aktarırken o formata sadık kalsınlar.
Kullanım Senaryoları
E-Mail (Elektronik Bilişim) Tamircisi
ISO formatında çuvallayan kadim elektronik postalardan size ulaşan bozulmuş metni dize çevirip rahatça e-postayı dikizleyin.
CSV Çizelgesi Onarıcı (BOM)
Excel üzerinden kurcalanıp iç organları darmadağın edilmiş ticari veri kümesini (CSV/BOM) aklayan ve listeyi net gösteren mühendislik.
Web - Sunucu Log Okuma
API kancalarındaki şifreleme ve Database / Veritabanı aksamından sebep dış dünyaya garip sızan kelime öbeklerini onarma.
Terk Edilmiş Sistemler (Mirage)
Modem bağlantısı / eski DOS devrinden kurtarıp getirdiğiniz çöp olmuş (yıkılmış) formatları enjekte ile yepyeni UTF-8 düzenine entegre etme.
Teknik Konfigürasyon
Bozuk Karakter (Olayı) Neden Doğar?
Kelimelerin beyninde ve en temel damarlarında yatan bayt kümeleri (makine verisi), ekran kartınız onu farklı yorumlayınca saçmalar. Yani aslen Shift_JIS yapısıyla harmanlanmış şifreyi UTF-8 gözlüğüyle süzmeye kalkarsanız mozilla ekranda rastgele harfler sallanır.
En Popüler Bozulma Formülleri
- UTF-8 Sistematiğini (Shift JİS'e Kurban Etme): Ekseriyetle sürekli tekrar eden "繧"-"縺"-"繝" silsilelerine denir. İnternetin göbeğinde en sık yaşanan talihsiz formüldür.
- Shift JİS Formatını (UTF-8 Sistemine Hapsetme): Soru işaretli boş küp ve kontrol hatalı karelerin kol gezdiği antik çağ CSV belasının özüdür.
Desteklediğimiz Formüller - Çatı Mimarisi
Tüm süreçler TextDecoder denilen siber güvenlik / evrensel API omurgasıyla desteklidir. Saçmalanmış metinden yola çıkıp sayısız iterasyonda şifreli bayt kombinasyonuna tek tek girip en olası denemeyi haritaya basar.
- Basamak I (19 Klasik Varyasyon): UTF ve SJİS gibi kodlardan 1'i birinde yaşanan sekme sarsıntılarını tarayarak hatasız çevirir.
- Basamak II (10 Komplike Varyasyon): Çifte kavrulmuş bozukluk dedikleri; UTF'den kayan yetmemiş gibi üstüne CP1252 bataklığına bulaşmış efsane şifre kırıcı kademesidir.