digtools
🔤
mojibake fixer,

Corrector Mojibake y Convertidor de Codificación

Corrige texto incomprensible (Mojibake) al instante.Conversor de codificación basado en tu navegador.

⚡️
Procesamiento en Navegador
Nada se envía a un servidor
✨️
Sin Registro
Usa al instante sin crear cuenta
🛡️
Recuperación Instantánea
Pega texto para ver todas las conversiones

Texto a Restaurar

0 caracteres
Soltar archivo para cargar
about,

¿Qué es el Corrector Mojibake?

Esta herramienta gratuita restaura automáticamente texto incomprensible (Mojibake) al pegarlo. Autodetecta todos los patrones de conversión entre UTF-8 / Shift_JIS / EUC-JP / ISO-2022-JP y presenta el resultado más natural.

Todo el procesamiento se realiza en tu navegador a través de JavaScript: tu información sensible nunca se envía a un servidor externo. No requiere registro ni inicio de sesión, permitiéndote usarlo con total privacidad.

how to,

Cómo Restaurar

STEP 1

Ingresa Texto

Pega el texto ilegible en el área de texto. También puedes arrastrar archivos de texto (.txt, .csv) con la codificación dañada.

STEP 2

Revisa Candidatos

Inmediatamente se verificarán todos los patrones de conversión y se listarán. Busca la opción que tenga la etiqueta "Recomendado".

STEP 3

Copia el Resultado

Haz clic en el botón "Copiar" en el bloque del texto correctamente restaurado para guardarlo en tu portapapeles.

glossary,

Glosario

Mojibake (Texto Codificado)
Fenómeno japonés acuñado cuando el software abre un archivo usando el set de decodificación incorrecto, transformando palabras a símbolos alienígenas incomprensibles ("縺").
Codificación UTF-8
El bloque internacional estándar moderno donde recae todo caracter. Desafortunadamente, software asiático viejo no lo procesa bien sin un BOM, generando mojibake.
Shift_JIS (Entorno Windows JP)
Arquitectura de escritura japonesa prevalente en equipos de Windows Japón. Si abres documentos Mac/UTF-8 aquí surgirán extrañas mutaciones simbólicas.
EUC-JP / JIS
Plataformas Unix y normativas de mensajería del pasado siglo. La des-configuración de estos produce textos que exhiben códigos de control caóticos y letras aleatorias.
Decodificación Inversa
El tratamiento tecnológico de regresar el "Texto Basura" a bytes puros en la memoria de Javascript, para recodificar e interpretar aplicando el lente y diccionario correctos.
Corrupción Irreversible
Cuando una base de datos purga agresivamente bytes foráneos reemplazándolos con caracteres como (?) o (□), imposibilitando totalmente la labor de recuperación matemática segura.
Ataque algorítmico global
El procedimiento detrás del fijador: itera múltiples rutas de codificación versus des-codificación secuencialmente para exponer una versión de texto coherente.
faq,

Preguntas Frecuentes

Q.¿Por qué hay piezas corrompidas de texto que esto no logra restaurar?
Cuando el texto "basura" es accidentalmente guardado nuevamente, frecuentemente se descartan bits ocultos. Si se produce destrucción estructural irreversible ("?"), ningún sistema en el mundo lo revivirá.
Q.Hay contraseñas en mi texto destrozado, ¿Peligra mi seguridad si uso esto?
No hay peligro absoluto. El sistema no tiene conexión transaccional backend (servidor); emplea el motor de su propio navegador de modo offline utilizando APIs de manipulación nativas.
Q.¿Qué denotan los rótulos de error como "Apertura en EUC-JP de original UTF-8"?
Esto evidencia la ruta forense del fallo. Le está indicando que su creador guardó su obra como "UTF-8", y la herramienta que usted ahora usa tiene sus tuercas amarradas asumiendo torpemente "EUC-JP".
Q.Hay varias ventanas en el resultado, ¿Cómo selecciono la verdadera reparación?
Efectuamos un "Ataque a la Fuerza". Lea las tarjetas escupidas en la interfaz del tablero y escoja la caja que milagrosamente contiene dicción, gramática e ideogramas japoneses entendibles.
Q.Tengo un correo con ideogramas "縺" que llegó hoy. ¿El motor puede componer esto?
Afirmativo. Se trata del síntoma más clásico de choque tecnológico "UTF-8 leído como Shift_JIS". Este motor lo decodificará devolviéndolo a japonés nítido inmediatamente.
Q.Mis Emojis se volvieron cuadros transparentes, ¿La app tiene un des-cifrador?
Lamentablemente no. Si el software originario destrozó el Emoji de 4 bytes aplanándolo a una caja blanca hueca, los detalles vitales fueron suprimidos, imposibilitando la ingeniería en reversa.
Q.¿Cuál es la cura médica para cesar de experimentar el agobiante Mojibake?
Promulgue internamente con clientes la adopción inquebrantable que todo guardado (E-mail, base de datos, bloc de notas) se imponga bajo el manto de formato del "UTF-8" como norma rectora corporativa.
use cases,

Casos de uso

📧

Recuperar emails corruptos

Restaura texto ilegible de correos enviados con codificación ISO-2022-JP o Shift_JIS.

📂

Reparar archivos CSV

Corrige problemas de codificación al abrir CSVs en Excel, incluyendo UTF-8 con BOM.

🌐

Recuperar datos web

Repara texto corrupto de bases de datos o APIs causado por incompatibilidad de codificación.

📋

Migración de sistemas legados

Convierte datos corruptos de sistemas antiguos a codificación UTF-8 correcta.

technology,

Detalles Técnicos

¿Por qué ocurre este Mojibake?

El texto se almacena internamente en secuencias de bytes. Esos bytes procesarán un texto distinto dependiendo qué codificador utilizaron para interpretarlos. El Mojibake ocurre cuando la capa lectora trata de revelar los datos usando (ej. "UTF-8") siendo que sus registros originales pertenecían a otro modelo (ej. "Shift_JIS").

Patrones más Comunes de Mojibake

  • Leído de UTF-8 → a Shift_JIS: Generará un patrón seguido de un sinfín de caracteres extraños y kanjis como "繧" "縺" "繝". Esto es el más clásico de todos los errores web.
  • Leído de Shift_JIS → a UTF-8: Incluirá caracteres de reemplazo. Son sumamente propensos a ocurrir en archivos antiguos de extension CSV.

Cómo Funciona la Herramienta

Utilizamos una función de navegador en segundo plano conocida como `TextDecoder` API. Extrae el código en crudo y lo codifica sistemáticamente con variaciones múltiples atacándolo por fuerza bruta.

  • 1 Sóla Fase (19 patrones): Recupera daños originados de una lectura errónea simple (es decir UTF-8 ↔ SJIS).
  • Múltiples fases (10 patrones): Reintenta cruces donde las capas de corrupción encadenaron más de 2 veces en sucesión y los caracteres parecen irreconocibles.