Corrigir a separação de dakuten no Mac
(normalização Unicode)
Corrija instantaneamente a separação de nomes de arquivos específicos do Mac no navegador
.
🔍 Análise Detalhada
Sobre
Uma ferramenta online que realiza a normalização de texto Unicode (NFC/NFD/NFKC/NFKD) em tempo real. Você pode facilmente realizar o processamento de normalização necessário para unificar códigos de caracteres e compará-los.
Suporta padrões de normalização frequentes no processamento de texto, como unificar caracteres de largura total e meia largura, combinar/separar marcas sonoras e normalizar caracteres compatíveis. Também é possível exibir pontos de código de caracteres.
Todo o processamento é realizado dentro do navegador e nenhum dado é enviado ao servidor.
Como Usar
Insira o texto
Insira ou cole o texto que deseja normalizar no campo de entrada.
Selecione o formato
Selecione o formato de normalização: NFC, NFD, NFKC ou NFKD.
Confirmar/Copiar resultado
Verifique as alterações no texto e nos pontos de código após a normalização e copie.
Glossário
- Normalização Unicode
- Processo de converter texto para uma forma canônica Unicode, para que diferentes sequências de pontos de código que representam o mesmo caractere sejam tratadas de forma idêntica.
- NFC (Composição Canônica)
- Decompõe os caracteres e depois os recompõe em forma pré-composta. É a forma de normalização mais usada em conteúdo web e processamento de texto geral.
- NFD (Decomposição Canônica)
- Decompõe os caracteres em um caractere base mais caracteres combinantes. Utilizado nos sistemas de arquivos do macOS e alguns ambientes Unix.
- NFKC (Composição de Compatibilidade)
- Converte os caracteres de compatibilidade para suas formas padrão e depois os compõe. Muito usado para busca e normalização de dados.
- Caracteres Combinantes
- Pontos de código Unicode que se anexam ao caractere base anterior em vez de serem independentes, como marcas de acento e diacríticos.
- Caracteres de Compatibilidade
- Caracteres com pontos de código distintos mas significado ou aparência equivalente a formas padrão, como ASCII de largura total ou números em círculo.
- Ponto de Código
- Identificador numérico único atribuído a cada caractere em Unicode, escrito como U+XXXX (por exemplo, U+3042 para o hiragana あ).
FAQ
- Qual é a diferença entre NFC e NFKC?
- NFC unifica a codificação interna sem alterar o texto visível. NFKC também converte caracteres de compatibilidade, por exemplo, dígitos de largura total para meia largura.
- Qual forma devo usar?
- Use NFC para texto geral. Use NFKC antes de armazenar em bancos de dados ou indexar buscas. Considere NFD se precisar de compatibilidade com macOS.
- Meu texto é enviado a um servidor?
- Não. Toda a normalização é executada localmente no seu navegador. O texto nunca é transmitido a nenhum servidor externo.
- A normalização pode eliminar caracteres?
- Normalmente não. No entanto, NFKC pode alterar visualmente alguns caracteres, por exemplo, convertendo letras de largura total para meia largura.
- Por que a comparação de strings precisa de normalização?
- O mesmo caractere visível pode ter codificações internas distintas. Normalizar para uma forma comum garante que as comparações e buscas funcionem de forma confiável.
- É especialmente útil para texto em japonês?
- Sim. Documentos japoneses costumam misturar caracteres de largura total e meia largura. A normalização resolve essas inconsistências e melhora a qualidade dos dados.
- Como copio o resultado?
- Clique no botão de copiar que aparece sobre a área de saída para salvar o texto normalizado na área de transferência.
Casos de Uso
Unificação de bancos de dados
Garanta a uniformidade dos dados normalizando a entrada do usuário.
Comparação de strings
Realize comparações e buscas precisas utilizando strings normalizadas.
Pré-processamento de texto
Aplique a normalização como pré-processamento para processamento de linguagem natural e análise de dados.
Investigação de código de caracteres
Verifique o ponto de código do caractere. Para investigar problemas de codificação.
Técnico
String.prototype.normalize() API
Como utiliza apenas funções nativas específicas do navegador, mesmo dados de strings grandes podem ser normalizados instantaneamente em poucos milissegundos.