digtools
🔤
mojibake fixer,

Corretor Mojibake e Conversor de Codificação

Corrija texto incompreensível (Mojibake) instantaneamente.Conversor de codificação baseado no seu navegador.

⚡️
Processamento no Navegador
Nada é enviado ao servidor
✨️
Sem Cadastro
Use imediatamente sem criar conta
🛡️
Recuperação Instantânea
Cole texto para ver todas as conversões

Texto a Restaurar

0 caracteres
Solte o arquivo para selecionar
about,

Visão geral da ferramenta de correção de Mojibake

Esta ferramenta online gratuita restaura automaticamente texto ilegível (Mojibake) ao formato original legível, bastando colá-lo. Seja texto distorcido recebido de uma transferência de arquivos entre Windows e Mac, ou dados corrompidos extraídos de um sistema legado, esta ferramenta resolve problemas de codificação de texto instantaneamente.

Detecta e testa automaticamente todos os padrões de conversão entre UTF-8, Shift_JIS (SJIS / CP932), EUC-JP e ISO-2022-JP, e apresenta o resultado mais natural e coerente — poupando o trabalho de adivinhar manualmente qual codificação de caracteres foi utilizada.

Todo o processamento de restauração é executado inteiramente no seu navegador. Seus dados sensíveis, incluindo documentos confidenciais e informações de clientes, nunca são transmitidos ou armazenados em nenhum servidor externo. Não requer instalação de software, criação de conta nem login — tornando-o seguro e privado o suficiente para uso profissional cotidiano.

cause,

Por que o Mojibake acontece? Causas comuns explicadas

A incompatibilidade de codificação de caracteres é a causa raiz

Em um computador, todos os dados de texto são armazenados como uma sequência de números (bytes — zeros e uns). O manual de regras que mapeia esses números para caracteres legíveis é chamado de "codificação de caracteres" (como UTF-8 ou Shift_JIS).

Por exemplo, o mesmo caractere japonês "あ" é representado por valores de bytes completamente diferentes em UTF-8 versus Shift_JIS. Se o remetente salva um arquivo usando Shift_JIS, mas o software do destinatário abre-o erroneamente como UTF-8, os bytes são interpretados com o manual de regras errado — e a tela exibe caracteres ilegíveis. Isso é Mojibake.

Padrões comuns de Mojibake

  • UTF-8 lido erroneamente como Shift_JIS:
    O tipo mais comum de mojibake na web. Aparecem kanjis desconhecidos como "繧", "縺" e "繝" em sequências longas sem sentido. Isso acontece frequentemente quando um arquivo criado no Mac é aberto com software Windows antigo.
  • Shift_JIS lido erroneamente como UTF-8:
    A maioria dos caracteres é substituída por "" (o losango preto com ponto de interrogação) ou literais "?". Se o texto foi salvo após essa substituição, os dados de bytes originais são perdidos permanentemente, tornando a recuperação completa impossível.
how to,

Como corrigir o Mojibake — Guia passo a passo

PASSO 1

Cole o texto ilegível

Cole o texto ilegível que deseja decodificar na área de entrada acima. Também pode arrastar e soltar arquivos de texto (.txt, .csv) com codificação corrompida diretamente na ferramenta.

PASSO 2

Escolha o resultado correto

Dezenas de padrões de conversão de codificação são testados automaticamente em segundo plano. Navegue pelos resultados e procure o que tem o selo "★ Recomendado" — ele indica o texto japonês mais legível e natural.

PASSO 3

Copie ou tente a conversão manual

Clique no botão "Copiar" no resultado corretamente restaurado para salvar o texto limpo na área de transferência. Se a detecção automática não produzir o resultado correto, use o painel "Conversão Manual" para especificar o par de codificação exato.

glossary,

Glossário de Mojibake e codificação

Mojibake (Texto ilegível)
Um fenômeno de erro onde a codificação de caracteres usada para criar e salvar um arquivo de texto não corresponde à codificação usada para abri-lo e lê-lo, fazendo com que os caracteres apareçam como símbolos ilegíveis e sem sentido (ex.: "縺ゅ>縺"). Uma ferramenta de conversão de código de caracteres é necessária para restaurar a codificação correta.
UTF-8 (Unicode Transformation Format)
O padrão de codificação de caracteres mais amplamente adotado na internet moderna e em sistemas operacionais (uma variante do Unicode). Pode lidar com caracteres de praticamente todos os idiomas simultaneamente, mas é frequentemente lido erroneamente como Shift_JIS por softwares Windows antigos, causando mojibake.
Shift_JIS (SJIS / CP932)
Uma codificação de caracteres legada específica para o idioma japonês, amplamente utilizada em ambientes Windows antigos. Abrir texto UTF-8 moderno em um aplicativo exclusivo Shift_JIS (como versões antigas do Excel) produz o padrão de mojibake característico com "縺".
EUC-JP / ISO-2022-JP
EUC-JP era comumente usado em servidores Linux e Unix antigos. ISO-2022-JP (também conhecido como codificação JIS) era o padrão para comunicações de e-mail japonesas antigas. Ambos continuam sendo fontes de mojibake ao interagir com sistemas modernos.
Codificar (Encode)
O processo de converter texto legível em uma sequência de bytes (dados digitais) de acordo com um padrão de codificação de caracteres específico, como UTF-8 ou Shift_JIS, para que computadores possam armazená-lo e processá-lo.
Decodificar (Decode)
O processo inverso: converter dados de bytes de volta em texto legível de acordo com um manual de regras de codificação de caracteres. Quando o manual de regras errado é aplicado durante a decodificação, o mojibake aparece na tela.
faq,

Perguntas frequentes sobre o Mojibake

Q.Há senhas no meu texto corrompido. Minha segurança está em risco ao usar esta ferramenta?
Não há risco algum. O sistema não tem conexão transacional com backend (servidor); utiliza o motor do próprio navegador offline usando APIs nativas de manipulação.
Q.É possível corrigir arquivos CSV corrompidos?
Sim, você pode arrastar e soltar o arquivo CSV corrompido ou selecioná-lo no botão de carregar. Após restaurar, salve como UTF-8 com BOM para abri-lo corretamente no Excel.
Q.Por que há partes do texto corrompidas que esta ferramenta não consegue restaurar?
Quando o texto 'lixo' é salvo acidentalmente novamente, bits ocultos frequentemente são descartados. Se ocorrer destruição estrutural irreversível ('?'), nenhum sistema no mundo conseguirá recuperá-lo.
Q.O que significam rótulos como 'Abertura em EUC-JP do original UTF-8'?
Isso evidencia a rota forense da falha. Indica que o criador salvou como 'UTF-8', mas a ferramenta usada assumiu erroneamente 'EUC-JP'.
Q.Há vários resultados exibidos. Como selecionar a recuperação correta?
Realizamos um 'Ataque de Força Bruta'. Leia os cartões exibidos na interface e escolha o que milagrosamente contém texto japonês compreensível.
Q.Recebi um e-mail com ideogramas '縺' hoje. O motor consegue corrigir isso?
Afirmativo. É o sintoma mais clássico de conflito tecnológico 'UTF-8 lido como Shift_JIS'. Este motor irá decodificá-lo devolvendo ao japonês nítido imediatamente.
Q.Meus Emojis viraram caixas transparentes. A ferramenta tem um decodificador?
Infelizmente não. Se o software original destruiu o Emoji de 4 bytes transformando-o em uma caixa vazia, os dados vitais foram suprimidos, impossibilitando a engenharia reversa.
Q.Qual é a solução definitiva para parar de sofrer com o Mojibake?
Adote internamente com clientes a convenção de que todo salvamento (E-mail, banco de dados, bloco de notas) seja feito em formato universal 'UTF-8' como norma corporativa.
use cases,

Cenários comuns de Mojibake e soluções

Aqui estão as situações mais comuns onde o mojibake ocorre, junto com soluções práticas.

📂

Arquivos CSV ilegíveis ao abrir no Excel

Quando você abre um arquivo CSV codificado em UTF-8 (ex.: exportado de um aplicativo web) clicando duas vezes nele no Windows Excel, o Excel pode tentar lê-lo como Shift_JIS, causando mojibake.

Solução: Solte o arquivo nesta ferramenta para restaurá-lo, ou use a aba "Dados" do Excel → assistente de importação "De Texto/CSV" e especifique UTF-8 como a codificação de origem.

📧

E-mails recebidos estão ilegíveis

Isso acontece quando o cliente de e-mail do remetente usa uma codificação antiga como ISO-2022-JP ou EUC-JP, mas o programa de e-mail do destinatário (Outlook, Gmail, etc.) tenta processá-lo como UTF-8.

Solução: Copie todo o corpo do e-mail ilegível e cole-o na área de entrada desta ferramenta para decodificar e restaurar a mensagem original.

🗜️

Nomes de arquivos ZIP ilegíveis entre Mac e Windows

Quando um arquivo ZIP criado no Mac é extraído no Windows usando o extrator nativo, os nomes dos arquivos podem ficar ilegíveis. Isso ocorre porque o Mac armazena nomes de arquivos em UTF-8, enquanto o Windows tenta interpretá-los como Shift_JIS.

Solução: Use uma ferramenta de extração compatível com UTF-8 como o 7-Zip, ou use um utilitário de compactação compatível com Windows no lado do Mac.

🌐

Site inteiro aparece ilegível no navegador

Isso ocorre quando a meta tag do arquivo HTML (declaração de charset) não corresponde à codificação real em que o arquivo foi salvo.

Solução: Use uma extensão do navegador para alterar manualmente a codificação do texto, ou o administrador do site precisa corrigir a declaração de charset no HTML.

technology,

Como funciona o algoritmo de recuperação (detalhes técnicos)

Processamento seguro e nativo do navegador via TextDecoder API

Para restaurar o mojibake, esta ferramenta utiliza as APIs TextEncoder e TextDecoder integradas nos navegadores modernos. Extrai os code points do texto ilegível de entrada e realiza a conversão de bytes e redecodificação em todas as codificações suportadas — inteiramente no lado do cliente.

Isso significa que nenhum dado é enviado a um servidor externo, tornando o processo de reparação extremamente seguro e rápido.

Detecção automática por força bruta e pontuação

Para qualquer entrada, a ferramenta executa dezenas de testes de conversão de forma assíncrona em segundo plano:

  • Conversão de estágio único (19 padrões): Abrange todo mojibake comum causado por uma única interpretação de codificação incorreta (ex.: dados que eram UTF-8 mas foram abertos como Shift_JIS).
  • Multi-estágio / mojibake duplo (10 padrões): Aborda casos complexos onde os dados passaram por múltiplos sistemas e foram convertidos incorretamente duas ou mais vezes (ex.: corrupção em cadeia SJIS → CP1252 → UTF-8).

Cada resultado é pontuado usando um algoritmo proprietário que avalia a frequência de caracteres japoneses (hiragana, katakana, kanjis comuns), a proporção de caracteres ASCII e a prevalência de caracteres de substituição corrompidos (? ou ). O resultado com a maior pontuação — considerado o "japonês mais natural" — recebe o selo "★ Recomendado".

Enviar feedback

Deixe-nos saber sua opinião para nos ajudar a melhorar a ferramenta.

Aviso Legal

As ferramentas disponibilizadas neste site são totalmente gratuitas, mas devem ser utilizadas por sua conta e risco. Não garantimos a precisão, integridade ou segurança dos resultados de cálculos, conversões ou dados gerados. Esteja ciente de que o operador não assume nenhuma responsabilidade por quaisquer danos ou problemas causados pelo uso dessas ferramentas. A maioria das ferramentas processa arquivos e cálculos localmente no seu navegador, o que significa que os dados inseridos não são enviados nem armazenados em nossos servidores.