Há senhas no meu texto corrompido. Minha segurança está em risco ao usar esta ferramenta?

Não há risco algum. O sistema não tem conexão transacional com backend (servidor); utiliza o motor do próprio navegador offline usando APIs nativas de manipulação.

É possível corrigir arquivos CSV corrompidos?

Sim, você pode arrastar e soltar o arquivo CSV corrompido ou selecioná-lo no botão de carregar. Após restaurar, salve como UTF-8 com BOM para abri-lo corretamente no Excel.

Por que há partes do texto corrompidas que esta ferramenta não consegue restaurar?

Quando o texto 'lixo' é salvo acidentalmente novamente, bits ocultos frequentemente são descartados. Se ocorrer destruição estrutural irreversível ('?'), nenhum sistema no mundo conseguirá recuperá-lo.

O que significam rótulos como 'Abertura em EUC-JP do original UTF-8'?

Isso evidencia a rota forense da falha. Indica que o criador salvou como 'UTF-8', mas a ferramenta usada assumiu erroneamente 'EUC-JP'.

Há vários resultados exibidos. Como selecionar a recuperação correta?

Testamos várias combinações possíveis. Leia os cartões exibidos na interface e escolha o que apresenta texto japonês compreensível.

Recebi um e-mail com ideogramas '縺' hoje. O motor consegue corrigir isso?

Sim. É o sintoma mais clássico de conflito tecnológico 'UTF-8 lido como Shift_JIS'. Este motor irá decodificá-lo devolvendo ao japonês nítido imediatamente.

Meus Emojis viraram caixas transparentes. A ferramenta tem um decodificador?

Infelizmente não. Se o software original destruiu o Emoji de 4 bytes transformando-o em uma caixa vazia, os dados vitais foram suprimidos, impossibilitando a engenharia reversa.

Qual é a solução definitiva para parar de sofrer com o Mojibake?

Adote internamente com clientes a convenção de que todo salvamento (E-mail, banco de dados, bloco de notas) seja feito em formato universal 'UTF-8' como norma corporativa.

🔤

mojibake fixer,

Corretor Mojibake e Conversor de Codificação

Corrija texto incompreensível (Mojibake) instantaneamente.
Conversor de codificação baseado no seu navegador.

⚡️

Processamento no Navegador

Nada é enviado ao servidor

✨️

Sem Cadastro

Use imediatamente sem criar conta

🛡️

Recuperação Instantânea

Cole texto para ver todas as conversões

Texto a Restaurar

Selecionar Arquivo

0 caracteres

Solte o arquivo para selecionar

Agora que seu texto está corrigido, experimente essas ferramentas

📝

Contador de Caracteres

Conte os caracteres do texto restaurado

🔄

Substituição de Texto

Buscar e substituir no texto

🔗

Codificador de URL

Converte caracteres especiais para URLs

about,

Visão geral da ferramenta de correção de Mojibake

Esta ferramenta online gratuita restaura automaticamente texto ilegível (Mojibake) ao formato original legível, bastando colá-lo. Seja texto distorcido recebido de uma transferência de arquivos entre Windows e Mac, ou dados corrompidos extraídos de um sistema legado, esta ferramenta resolve problemas de codificação de texto instantaneamente.

Detecta e testa automaticamente todos os padrões de conversão entre UTF-8, Shift_JIS (SJIS / CP932), EUC-JP e ISO-2022-JP, e apresenta o resultado mais natural e coerente — poupando o trabalho de adivinhar manualmente qual codificação de caracteres foi utilizada.

Todo o processamento de restauração é executado inteiramente no seu navegador. Seus dados sensíveis, incluindo documentos confidenciais e informações de clientes, nunca são transmitidos ou armazenados em nenhum servidor externo. Não requer instalação de software, criação de conta nem login — tornando-o seguro e privado o suficiente para uso profissional cotidiano.

cause,

Por que o Mojibake acontece? Causas comuns explicadas

A incompatibilidade de codificação de caracteres é a causa raiz

Em um computador, todos os dados de texto são armazenados como uma sequência de números (bytes — zeros e uns). O manual de regras que mapeia esses números para caracteres legíveis é chamado de "codificação de caracteres" (como UTF-8 ou Shift_JIS).

Por exemplo, o mesmo caractere japonês "あ" é representado por valores de bytes completamente diferentes em UTF-8 versus Shift_JIS. Se o remetente salva um arquivo usando Shift_JIS, mas o software do destinatário abre-o erroneamente como UTF-8, os bytes são interpretados com o manual de regras errado — e a tela exibe caracteres ilegíveis. Isso é Mojibake.

Padrões comuns de Mojibake

UTF-8 lido erroneamente como Shift_JIS:
O tipo mais comum de mojibake na web. Aparecem kanjis desconhecidos como "繧", "縺" e "繝" em sequências longas sem sentido. Isso acontece frequentemente quando um arquivo criado no Mac é aberto com software Windows antigo.
Shift_JIS lido erroneamente como UTF-8:
A maioria dos caracteres é substituída por "" (o losango preto com ponto de interrogação) ou literais "?". Se o texto foi salvo após essa substituição, os dados de bytes originais são perdidos permanentemente, tornando a recuperação completa impossível.

how to,

Como corrigir o Mojibake — Guia passo a passo

PASSO 1

Cole o texto ilegível

Cole o texto ilegível que deseja decodificar na área de entrada acima. Também pode arrastar e soltar arquivos de texto (.txt, .csv) com codificação corrompida diretamente na ferramenta.

PASSO 2

Escolha o resultado correto

Dezenas de padrões de conversão de codificação são testados automaticamente em segundo plano. Navegue pelos resultados e procure o que tem o selo "★ Recomendado" — ele indica o texto japonês mais legível e natural.

PASSO 3

Copie ou tente a conversão manual

Clique no botão "Copiar" no resultado corretamente restaurado para salvar o texto limpo na área de transferência. Se a detecção automática não produzir o resultado correto, use o painel "Conversão Manual" para especificar o par de codificação exato.

glossary,

Glossário de Mojibake e codificação

Mojibake (Texto ilegível): Um fenômeno de erro onde a codificação de caracteres usada para criar e salvar um arquivo de texto não corresponde à codificação usada para abri-lo e lê-lo, fazendo com que os caracteres apareçam como símbolos ilegíveis e sem sentido (ex.: "縺ゅ＞縺"). Uma ferramenta de conversão de código de caracteres é necessária para restaurar a codificação correta.
UTF-8 (Unicode Transformation Format): O padrão de codificação de caracteres mais amplamente adotado na internet moderna e em sistemas operacionais (uma variante do Unicode). Pode lidar com caracteres de praticamente todos os idiomas simultaneamente, mas é frequentemente lido erroneamente como Shift_JIS por softwares Windows antigos, causando mojibake.
Shift_JIS (SJIS / CP932): Uma codificação de caracteres legada específica para o idioma japonês, amplamente utilizada em ambientes Windows antigos. Abrir texto UTF-8 moderno em um aplicativo exclusivo Shift_JIS (como versões antigas do Excel) produz o padrão de mojibake característico com "縺".
EUC-JP / ISO-2022-JP: EUC-JP era comumente usado em servidores Linux e Unix antigos. ISO-2022-JP (também conhecido como codificação JIS) era o padrão para comunicações de e-mail japonesas antigas. Ambos continuam sendo fontes de mojibake ao interagir com sistemas modernos.
Codificar (Encode): O processo de converter texto legível em uma sequência de bytes (dados digitais) de acordo com um padrão de codificação de caracteres específico, como UTF-8 ou Shift_JIS, para que computadores possam armazená-lo e processá-lo.
Decodificar (Decode): O processo inverso: converter dados de bytes de volta em texto legível de acordo com um manual de regras de codificação de caracteres. Quando o manual de regras errado é aplicado durante a decodificação, o mojibake aparece na tela.

faq,

Perguntas frequentes sobre o Mojibake

Q.Há senhas no meu texto corrompido. Minha segurança está em risco ao usar esta ferramenta?: Não há risco algum. O sistema não tem conexão transacional com backend (servidor); utiliza o motor do próprio navegador offline usando APIs nativas de manipulação.
Q.É possível corrigir arquivos CSV corrompidos?: Sim, você pode arrastar e soltar o arquivo CSV corrompido ou selecioná-lo no botão de carregar. Após restaurar, salve como UTF-8 com BOM para abri-lo corretamente no Excel.
Q.Por que há partes do texto corrompidas que esta ferramenta não consegue restaurar?: Quando o texto 'lixo' é salvo acidentalmente novamente, bits ocultos frequentemente são descartados. Se ocorrer destruição estrutural irreversível ('?'), nenhum sistema no mundo conseguirá recuperá-lo.
Q.O que significam rótulos como 'Abertura em EUC-JP do original UTF-8'?: Isso evidencia a rota forense da falha. Indica que o criador salvou como 'UTF-8', mas a ferramenta usada assumiu erroneamente 'EUC-JP'.
Q.Há vários resultados exibidos. Como selecionar a recuperação correta?: Testamos várias combinações possíveis. Leia os cartões exibidos na interface e escolha o que apresenta texto japonês compreensível.
Q.Recebi um e-mail com ideogramas '縺' hoje. O motor consegue corrigir isso?: Sim. É o sintoma mais clássico de conflito tecnológico 'UTF-8 lido como Shift_JIS'. Este motor irá decodificá-lo devolvendo ao japonês nítido imediatamente.
Q.Meus Emojis viraram caixas transparentes. A ferramenta tem um decodificador?: Infelizmente não. Se o software original destruiu o Emoji de 4 bytes transformando-o em uma caixa vazia, os dados vitais foram suprimidos, impossibilitando a engenharia reversa.
Q.Qual é a solução definitiva para parar de sofrer com o Mojibake?: Adote internamente com clientes a convenção de que todo salvamento (E-mail, banco de dados, bloco de notas) seja feito em formato universal 'UTF-8' como norma corporativa.

use cases,

Cenários comuns de Mojibake e soluções

Aqui estão as situações mais comuns onde o mojibake ocorre, junto com soluções práticas.

📂

Arquivos CSV ilegíveis ao abrir no Excel

Quando você abre um arquivo CSV codificado em UTF-8 (ex.: exportado de um aplicativo web) clicando duas vezes nele no Windows Excel, o Excel pode tentar lê-lo como Shift_JIS, causando mojibake.

Solução: Solte o arquivo nesta ferramenta para restaurá-lo, ou use a aba "Dados" do Excel → assistente de importação "De Texto/CSV" e especifique UTF-8 como a codificação de origem.

📧

E-mails recebidos estão ilegíveis

Isso acontece quando o cliente de e-mail do remetente usa uma codificação antiga como ISO-2022-JP ou EUC-JP, mas o programa de e-mail do destinatário (Outlook, Gmail, etc.) tenta processá-lo como UTF-8.

Solução: Copie todo o corpo do e-mail ilegível e cole-o na área de entrada desta ferramenta para decodificar e restaurar a mensagem original.

🗜️

Nomes de arquivos ZIP ilegíveis entre Mac e Windows

Quando um arquivo ZIP criado no Mac é extraído no Windows usando o extrator nativo, os nomes dos arquivos podem ficar ilegíveis. Isso ocorre porque o Mac armazena nomes de arquivos em UTF-8, enquanto o Windows tenta interpretá-los como Shift_JIS.

Solução: Use uma ferramenta de extração compatível com UTF-8 como o 7-Zip, ou use um utilitário de compactação compatível com Windows no lado do Mac.

🌐

Site inteiro aparece ilegível no navegador

Isso ocorre quando a meta tag do arquivo HTML (declaração de charset) não corresponde à codificação real em que o arquivo foi salvo.

Solução: Use uma extensão do navegador para alterar manualmente a codificação do texto, ou o administrador do site precisa corrigir a declaração de charset no HTML.

technology,

Como funciona o algoritmo de recuperação (detalhes técnicos)

Processamento seguro e nativo do navegador via TextDecoder API

Para restaurar o mojibake, esta ferramenta utiliza as APIs TextEncoder e TextDecoder integradas nos navegadores modernos. Extrai os code points do texto ilegível de entrada e realiza a conversão de bytes e redecodificação em todas as codificações suportadas — inteiramente no lado do cliente.

Isso significa que nenhum dado é enviado a um servidor externo, tornando o processo de reparação extremamente seguro e rápido.

Detecção automática por força bruta e pontuação

Para qualquer entrada, a ferramenta executa dezenas de testes de conversão de forma assíncrona em segundo plano:

Conversão de estágio único (19 padrões): Abrange todo mojibake comum causado por uma única interpretação de codificação incorreta (ex.: dados que eram UTF-8 mas foram abertos como Shift_JIS).
Multi-estágio / mojibake duplo (10 padrões): Aborda casos complexos onde os dados passaram por múltiplos sistemas e foram convertidos incorretamente duas ou mais vezes (ex.: corrupção em cadeia SJIS → CP1252 → UTF-8).

Cada resultado é pontuado usando um algoritmo proprietário que avalia a frequência de caracteres japoneses (hiragana, katakana, kanjis comuns), a proporção de caracteres ASCII e a prevalência de caracteres de substituição corrompidos (? ou ). O resultado com a maior pontuação — considerado o "japonês mais natural" — recebe o selo "★ Recomendado".