Corrector Mojibake y Convertidor de Codificación
Corrige texto incomprensible (Mojibake) al instante.
Conversor de codificación basado en tu navegador.
Texto a Restaurar
Ahora que tu texto está arreglado, prueba estas herramientas
Resumen de la herramienta de corrección de Mojibake
Esta herramienta en línea gratuita restaura automáticamente texto ilegible (Mojibake) con solo pegarlo. Ya sea que hayas recibido caracteres corruptos al transferir archivos entre Windows y Mac, o que hayas extraído datos dañados de un sistema antiguo, esta herramienta resuelve los problemas de codificación de texto al instante.
Detecta automáticamente y prueba todos los patrones de conversión entre UTF-8, Shift_JIS (SJIS / CP932), EUC-JP e ISO-2022-JP, y presenta el resultado más natural y coherente, ahorrándote la molestia de adivinar manualmente qué codificación de caracteres se utilizó.
Todo el procesamiento de restauración se ejecuta completamente dentro de tu navegador. Tus datos confidenciales, incluyendo documentos reservados e información de clientes, nunca se transmiten ni se almacenan en ningún servidor externo. No requiere instalación de software, creación de cuenta ni inicio de sesión, lo que lo hace seguro y privado para el uso profesional diario.
¿Por qué ocurre el Mojibake? Causas comunes explicadas
La causa raíz es la incompatibilidad de codificación de caracteres
En un ordenador, todos los datos de texto se almacenan como una secuencia de números (bytes — ceros y unos). El conjunto de reglas que convierte estos números en caracteres legibles se denomina "codificación de caracteres" (como UTF-8 o Shift_JIS).
Por ejemplo, el mismo carácter japonés "あ" se representa con valores de bytes completamente diferentes en UTF-8 y en Shift_JIS. Si el remitente guarda un archivo con Shift_JIS, pero el software del destinatario lo abre erróneamente como UTF-8, los bytes se interpretan con el conjunto de reglas incorrecto y la pantalla muestra caracteres basura. Esto es el Mojibake.
Patrones comunes de Mojibake
- UTF-8 leído como Shift_JIS:
El tipo más común de mojibake en la web. Aparecerán kanjis desconocidos como "繧", "縺" y "繝" en cadenas largas e incoherentes. Esto ocurre frecuentemente cuando un archivo creado en Mac se abre con software antiguo de Windows. - Shift_JIS leído como UTF-8:
La mayoría de los caracteres se reemplazan con "�" (el rombo negro con signo de interrogación) o con signos "?" literales. Si el texto se guardó tras esta sustitución, los datos originales de bytes se pierden permanentemente, haciendo imposible la recuperación completa.
Cómo corregir el Mojibake — Guía paso a paso
Pega el texto ilegible
Pega el texto ilegible que deseas decodificar en el área de entrada de arriba. También puedes arrastrar y soltar archivos de texto (.txt, .csv) con codificación dañada directamente en la herramienta.
Elige el resultado correcto
Docenas de patrones de conversión de codificación se prueban automáticamente en segundo plano. Navega por los resultados y busca el que tenga la marca "★ Recomendado", que indica el texto japonés más legible de forma natural.
Copia o prueba la conversión manual
Haz clic en el botón "Copiar" en el resultado correctamente restaurado para guardar el texto limpio en tu portapapeles. Si la detección automática no produce el resultado correcto, usa el panel de "Conversión Manual" para especificar el par de codificación exacto tú mismo.
Glosario de Mojibake y codificación
- Mojibake (texto ilegible)
- Fenómeno de error donde la codificación de caracteres usada para crear y guardar un archivo de texto no coincide con la codificación usada para abrirlo y leerlo, causando que los caracteres se muestren como símbolos incomprensibles (p. ej., "縺ゅ>縺"). Se necesita una herramienta de conversión de códigos de caracteres para restaurar la codificación correcta.
- UTF-8 (Unicode Transformation Format)
- El estándar de codificación de caracteres más ampliamente adoptado en el internet moderno y en los sistemas operativos (una variante de Unicode). Puede manejar caracteres de prácticamente todos los idiomas simultáneamente, pero es frecuentemente malinterpretado como Shift_JIS por software antiguo de Windows, causando mojibake.
- Shift_JIS (SJIS / CP932)
- Una codificación de caracteres heredada específica del idioma japonés, ampliamente utilizada en entornos antiguos de Windows. Abrir texto moderno UTF-8 en una aplicación exclusiva de Shift_JIS (como versiones antiguas de Excel) produce el patrón de mojibake distintivo "縺".
- EUC-JP / ISO-2022-JP
- EUC-JP se utilizaba comúnmente en servidores antiguos de Linux y Unix. ISO-2022-JP (también conocido como codificación JIS) fue el estándar para las primeras comunicaciones de correo electrónico japonesas. Ambos siguen siendo fuentes de mojibake al interactuar con sistemas modernos.
- Codificar (Encode)
- El proceso de convertir texto legible en una secuencia de bytes (datos digitales) según un estándar de codificación de caracteres específico como UTF-8 o Shift_JIS, para que los ordenadores puedan almacenarlo y procesarlo.
- Decodificar (Decode)
- El proceso inverso: convertir datos de bytes de vuelta a texto legible según un conjunto de reglas de codificación de caracteres. Cuando se aplica el conjunto de reglas incorrecto durante la decodificación, aparece el mojibake en la pantalla.
Preguntas frecuentes sobre el Mojibake
- Q.¿Se enviarán mis datos a un servidor privado?
- No. Todos los datos están asegurados localmente. El sistema emplea el motor de su propio navegador de modo sin conexión, por lo que nunca sube tu texto a la red.
- Q.¿Se arreglan archivos CSV?
- Sí, usted puede arrastrar y soltar el archivo CSV o seleccionarlo para intentar su lectura. Tras restaurarlo, guárdelo como archivo UTF-8 con BOM.
- Q.¿Por qué hay piezas corrompidas de texto que esto no logra restaurar?
- Cuando el texto fue guardado nuevamente de forma incorrecta, frecuentemente se descartan bits ocultos. Si se produce destrucción estructural irreversible e información faltante, no podrá recuperarse en su totalidad.
- Q.¿Qué denotan los rótulos de error como 'UTF-8 leído como Shift_JIS'?
- Esto evidencia la ruta forense del fallo. Indica que el documento original se guardó como 'UTF-8', pero el software que está usando ahora asume torpemente que es 'Shift_JIS'.
- Q.Hay varias ventanas en el resultado, ¿Cómo selecciono la verdadera reparación?
- Efectuamos un 'Ataque a Fuerza Bruta'. Lea las tarjetas mostradas en la interfaz y escoja la caja que contiene gramática e ideogramas japoneses entendibles.
- Q.Tengo un correo con ideogramas '縺' que llegó hoy. ¿El motor puede componer esto?
- Afirmativo. Se trata del síntoma más clásico de choque tecnológico 'UTF-8 leído como Shift_JIS'. Este motor lo decodificará devolviéndolo a japonés nítido inmediatamente.
- Q.Mis Emojis se volvieron cuadros transparentes, ¿La app tiene un des-cifrador?
- Lamentablemente no. Si el software originario destrozó el Emoji aplanándolo a una caja blanca hueca, los detalles vitales fueron suprimidos, imposibilitando la ingeniería en reversa.
- Q.¿Cómo puedo evitar experimentar el agobiante Mojibake?
- Promulgue internamente con clientes la adopción de guardar todo (E-mail, base de datos, bloc de notas) bajo el formato universal 'UTF-8' como norma rectora.
Casos comunes de Mojibake y soluciones
Estos son los escenarios más comunes donde ocurre el mojibake, junto con soluciones prácticas.
Archivos CSV ilegibles al abrir en Excel
Al abrir un archivo CSV codificado en UTF-8 (p. ej., exportado desde una aplicación web) haciendo doble clic en Windows Excel, Excel puede intentar leerlo como Shift_JIS, causando mojibake.
Solución: Arrastra el archivo a esta herramienta para restaurarlo, o usa la pestaña "Datos" de Excel → "Desde texto/CSV" y especifica UTF-8 como codificación de origen.
Correos electrónicos recibidos ilegibles
Esto ocurre cuando el cliente de correo del remitente usa una codificación antigua como ISO-2022-JP o EUC-JP, pero el lector del destinatario (Outlook, Gmail, etc.) intenta procesarlo como UTF-8.
Solución: Copia todo el cuerpo del correo ilegible y pégalo en el área de entrada de esta herramienta para decodificar y restaurar el mensaje original.
Nombres de archivos ZIP ilegibles entre Mac y Windows
Cuando un archivo ZIP creado en Mac se extrae en Windows con el extractor integrado, los nombres de los archivos pueden quedar ilegibles. Esto ocurre porque Mac almacena los nombres en UTF-8, mientras que Windows intenta interpretarlos como Shift_JIS.
Solución: Usa una herramienta de extracción compatible con UTF-8 como 7-Zip, o utiliza una utilidad de compresión compatible con Windows en el lado de Mac.
Sitio web completo aparece ilegible en el navegador
Esto ocurre cuando la etiqueta meta del archivo HTML (declaración de charset) no coincide con la codificación real con la que se guardó el archivo.
Solución: Usa una extensión del navegador para cambiar manualmente la codificación de texto, o el administrador del sitio debe corregir la declaración de charset en el HTML.
Cómo funciona el algoritmo de recuperación (detalles técnicos)
Procesamiento seguro y nativo del navegador mediante TextDecoder API
Para restaurar el mojibake, esta herramienta aprovecha las APIs TextEncoder y TextDecoder integradas en los navegadores modernos. Extrae los puntos de código del texto ilegible de entrada y realiza la conversión de bytes y la redecodificación en todas las codificaciones compatibles, completamente del lado del cliente.
Esto significa que ningún dato se envía jamás a un servidor externo, haciendo que el proceso de reparación sea extremadamente seguro y rápido.
Detección automática por fuerza bruta y puntuación
Para cualquier entrada dada, la herramienta ejecuta docenas de pruebas de conversión de forma asíncrona en segundo plano:
- Conversión de fase única (19 patrones): Cubre todo el mojibake común causado por una sola malinterpretación de codificación (p. ej., datos que en realidad eran UTF-8 pero se abrieron como Shift_JIS).
- Múltiples fases / doble mojibake (10 patrones): Aborda casos complejos donde los datos pasaron por múltiples sistemas y fueron mal convertidos dos o más veces (p. ej., cadena de corrupción SJIS → CP1252 → UTF-8).
Cada resultado se puntúa usando un algoritmo propietario que evalúa la frecuencia de caracteres japoneses (hiragana, katakana, kanji comunes), la proporción de caracteres ASCII y la prevalencia de caracteres de reemplazo corruptos (? o �). El resultado con la puntuación más alta — considerado como el "japonés más natural" — recibe la marca "★ Recomendado".
Enviar comentarios
Déjenos saber su opinión para ayudarnos a mejorar la herramienta.
Los comentarios están temporalmente suspendidos
El servidor está ocupado o la protección contra spam está activa. Inténtelo más tarde.