Normalização Unicode
(NFC / NFKC)
Corrija instantaneamente problemas de codificação de texto no navegador.
Processamento 100% local, sem envio ao servidor.
🔍 Análise detalhada (code points)
Sobre
Uma ferramenta online que realiza normalização de texto Unicode (NFC/NFD/NFKC/NFKD) em tempo real. Você pode executar facilmente o processamento de normalização necessário para unificar códigos de caracteres e compará-los.
Suporta padrões de normalização que ocorrem frequentemente no processamento de texto, como unificação de caracteres de largura total e meia largura, combinação/separação de marcas diacríticas e normalização de caracteres compatíveis.
Todo o processamento é concluído no navegador e nenhum dado é enviado ao servidor.
Como Usar
Inserir texto
Digite ou cole o texto que deseja normalizar no campo de entrada.
Selecionar formato
Selecione o formato de normalização: NFC, NFD, NFKC ou NFKD.
Confirmar/Copiar resultado
Verifique as alterações de texto e code point após a normalização e copie.
Glossário
- Normalização Unicode
- O processo de converter texto para uma forma canônica Unicode para que sequências de code point diferentes que representam o mesmo caractere sejam tratadas de forma idêntica.
- NFC (Composição Canônica)
- Decompõe os caracteres e os recompõe na forma pré-composta. A forma de normalização mais amplamente usada para conteúdo web e processamento de texto geral.
- NFD (Decomposição Canônica)
- Decompõe os caracteres em um caractere base mais caracteres combinados. Usado pelos sistemas de arquivos do macOS e alguns ambientes Unix.
- NFKC (Composição de Compatibilidade)
- Converte caracteres de compatibilidade (ex.: alfanuméricos de largura total) para suas formas padrão e depois compõe. Comumente usado para busca e normalização de dados.
- Caracteres Combinados
- Code points Unicode que se anexam a um caractere base anterior em vez de ficarem sozinhos, como marcas de acento e diacríticos.
- Caracteres de Compatibilidade
- Caracteres com code points distintos, mas significado ou aparência equivalente às formas padrão, como ASCII de largura total, números circulados.
- Code Point
- Um identificador numérico único atribuído a cada caractere no Unicode, escrito como U+XXXX (ex.: U+00E1 para a letra "á").
FAQ
- Qual é a diferença entre NFC e NFKC?
- NFC unifica a codificação interna sem alterar o texto visível. NFKC converte adicionalmente os caracteres de compatibilidade — por exemplo, dígitos de largura total se tornam meia largura.
- Qual formato devo usar?
- Use NFC para texto geral. Use NFKC antes do armazenamento em banco de dados ou indexação de busca. Considere NFD ao visar compatibilidade com macOS.
- Meu texto é enviado a um servidor?
- Não. Toda a normalização é executada localmente no seu navegador. Seu texto nunca é transmitido a qualquer servidor externo.
- A normalização pode excluir caracteres?
- Normalmente não. No entanto, NFKC pode alterar visualmente os caracteres — por exemplo, convertendo letras de largura total para seus equivalentes de meia largura.
- Por que a comparação de strings precisa de normalização?
- O mesmo caractere visível pode ter codificações internas diferentes. Normalizar para uma forma comum garante que comparações e buscas funcionem corretamente.
- Isso é especialmente útil para texto em português?
- Sim. Documentos em português frequentemente têm acentos (ã, ç, é) que podem ser representados de formas diferentes dependendo do sistema operacional. A normalização resolve essas inconsistências.
- Como copio o resultado?
- Clique no botão de copiar acima da área de saída para salvar o texto normalizado na área de transferência.
Casos de Uso
Unificação de banco de dados
Garanta uniformidade de dados normalizando a entrada do usuário antes de armazenar.
Comparação de strings
Obtenha comparações e buscas precisas usando strings normalizadas.
Pré-processamento de texto
Aplique normalização como pré-processamento para PLN e análise de dados.
Investigação de code points
Verifique o code point de caracteres. Para investigar problemas de codificação.
Técnico
API String.prototype.normalize()
Como apenas funções nativas específicas do navegador são usadas, mesmo dados de string extensos podem ser normalizados instantaneamente em poucos milissegundos.
Enviar feedback
Deixe-nos saber sua opinião para nos ajudar a melhorar a ferramenta.
O feedback está temporariamente suspenso
O servidor está ocupado ou a proteção contra spam está ativa. Tente novamente mais tarde.