Risolvi il problema della separazione dei diacritici su Mac
(Normalizzazione Unicode)
Corregge all’istante nei browser la separazione dei file
tipica dei sistemi Mac.
🔍 Analisi Dettagliata (Codici Punti / Code Points)
Potrebbe piacerti anche
Informazioni
Uno strumento online che esegue la normalizzazione del testo Unicode (NFC/NFD/NFKC/NFKD) in tempo reale. Puoi eseguire facilmente le elaborazioni necessarie per l’unificazione dei codici dei caratteri e la loro comparazione.
Supporta i pattern di normalizzazione che si verificano comunemente durante l’elaborazione del testo. È inoltre possibile visualizzare i punti di codice e le stringhe di byte dei singoli caratteri.
Tutta l’elaborazione viene completata all’interno del browser e nessun dato viene inviato al server.
Come si usa
Inserisci il testo
Inserisci o incolla il testo da normalizzare nel campo di input.
Seleziona il formato
Seleziona il formato di normalizzazione desiderato: NFC, NFD, NFKC o NFKD.
Conferma/Copia il risultato
Controlla il testo e le modifiche ai punti di codice dopo la normalizzazione; puoi copiarlo da qui.
Glossario
- Standard Unicode
- Lo standard IT universale per la codifica, la rappresentazione e la gestione coerenti del testo espresso nella maggior parte dei sistemi di scrittura del mondo, che garantisce che i caratteri appaiano in maniera identica a livello globale.
- Normalizzazione di stringhe
- Il processo per convertire stringhe, contenenti configurazioni binarie di caratteri visivamente identici ma fondamentalmente diversi, in una sequenza binaria unificata e prevedibile.
- Combinazione Caratteri / Diacritici
- Si tratta delle situazioni tipografiche in cui una lettera di base (ad esempio, "a") viene combinata a livello matematico con un segno di accento separato (ad esempio, "´") per formare quella che si andrà a visualizzare come un’unica lettera unificata ("á").
- NFD (Decomposizione Canonica)
- Una modalità di normalizzazione che scompone i caratteri composti nella loro lettera singola fondamentale più piccola più i segni di combinazione (che separi "ñ" in "n" e "~"). In sostanza, è un’opzione impostata come default nei file system macOS.
- NFC (Composizione Canonica)
- Lo standard per la rete internet maggiormente diffuso in assoluto. Unisce i caratteri di base e i rispettivi segni di accento andando a comporre un singolo carattere pre-composto (ad esempio, "n" + "~" diventa "ñ").
- NFKC (Composizione per Compatibilità)
- Un filtro di normalizzazione altamente spinto. Non solo unisce i segni di combinazione, ma distrugge in maniera forzosa tutte le sfumature della formattazione — arrivando così a trasformare gli apici (come "²") in numeri standard ("2") o a convertire le lettere a larghezza intera in equivalenti a larghezza ridotta.
- Collazione Database
- Le regole che dettano il modo in cui un database andrà a cercare e ad ordinare il testo. La mancata normalizzazione sicura delle stringhe tramite NFC prima dell’inserimento porta a gravi difetti nei malfunzionamenti delle query di ricerca.
FAQ
- Q.Perché la normalizzazione Unicode è essenziale per lo sviluppo di software?
- Se un utente inserisce un "ñ" tramite un dispositivo Linux e un altro utente inserisce "ñ" utilizzando un Mac, la composizione invisibile dei byte di questi simboli può risultare essere completamente diversa tra loro. Cercando nel database "ñ", si potrebbe non trovarlo affatto in almeno uno dei casi, a meno che non si normalizzi preventivamente tutto in formato NFC.
- Q.Quale delle quattro modalità dovrei realisticamente selezionare?
- A meno che non vi sia una ragione derivante da specifiche architetture di server arcaiche o particolari, è sufficiente selezionare sempre la "NFC". Il World Wide Web Consortium (W3C) impone NFC come l’unico standard strutturale in riferimento a tutti i protocolli Internet.
- Q.Perché un testo copiato da una cartella su un Mac appare bizzarro su un Windows?
- macOS forza intrinsecamente i nomi dei file nella formattazione NFD, rimuovendo le loro controparti diacritiche ed i marcatori fonetici per allontanarli dalla lettera di base. Il nostro strumento ripara all’istante tale problematica eseguendo la normale composizione NFC, incollando le parti nuovamente tra di loro.
- Q.Come faccio a rimuovere le formattazioni complesse come i numeri cerchiati o i minuscoli apici?
- Abilita l’impostazione in modalità "NFKC". Questa aggressiva e vasta fase orientata alla compatibilità annienta di proposito i fattori di forma decorativi e matematici, riducendoli a equivalenti testuali standard incredibilmente semplici (ad esempio, un "1" racchiuso in un cerchio diventerà un semplice "1").
- Q.Incollare archivi di file sensibili relativi al GDPR potrebbe crearmi problemi legali?
- Nessun dato esce mai dal tuo browser. Tutte le conversioni impiegano il metodo JavaScript integrato
String.normalize()— e non viene effettuata nessuna richiesta in rete. - Q.Esistono limitazioni nascoste e limiti in riferimento a grandi catene di stringhe o mega stringhe?
- Noi non applichiamo nessun troncamento software artificiale. I limiti hardware che governano i limiti della RAM nel browser indicano l’arresto anomalo. Puoi incollare in completa tranquillità romanzi che arrivino comodamente a un quarto di milione di caratteri e l’esito avverrà con la solita restituzione di input quasi del tutto istantanei.
- Q.Perché il conteggio esatto dei caratteri subisce variazioni impreviste dopo il clic su un processo?
- Laddove il motore comprime componenti separati (ad esempio, una lettera isolata e un accento isolato) in un singolo carattere dal grandioso aspetto usando la tecnologia NFC, il numero di conteggio limitato dei caratteri subirà un sensato calo. Invece, l’NFKC che va ad espandere la singola icona del "marchio registrato" in "TM" fa invece logicamente aumentare il numero del conteggio.
Casi d’uso
Unificazione database
Garantisci l’uniformità dei dati normalizzando l’input utente.
Comparazione di stringhe
Ottieni confronti e ricerche accurati tramite l’utilizzo delle stringhe normalizzate.
Pre-elaborazione testo
Applica la normalizzazione come pre-elaborazione per l’elaborazione del linguaggio naturale e l’analisi dei dati.
Ricerca codice caratteri
Controlla il code point del carattere. Ideale per investigare i problemi di codifica.
Tecnico
API String.prototype.normalize()
Poiché vengono utilizzate solo funzioni native proprie del browser, è possibile normalizzare istantaneamente in pochi millisecondi anche grandi quantità di dati sotto forma di stringhe.
Invia feedback
Facci sapere la tua opinione per aiutarci a migliorare lo strumento.
Il feedback è temporaneamente sospeso
Il server è occupato o la protezione antispam è attiva. Riprova più tardi.