Image OCR (Riconoscimento Testo)
Estrai testo da foto e screenshot nel tuo browser.
Completamente basato su browser: nessun dato viene caricato, nessuna registrazione.
Trascina e rilascia un'immagine
o clicca per selezionare
JPEG, PNG, WebP, BMP supportati (max 30 MB)
📋 Incolla dagli appunti con Ctrl+V
Informazioni
Lo strumento "Image OCR (Riconoscimento Testo)" è uno strumento online gratuito che legge il testo da foto e screenshot nel tuo browser e lo estrae come testo modificabile.
Utilizza Tesseract.js (versione WebAssembly), che esegue il motore OCR Tesseract di Google, leader del settore, direttamente nel browser. Supporta 5 lingue tra cui giapponese, inglese, cinese semplificato, coreano e spagnolo.
Tutta l'elaborazione viene eseguita in un Web Worker all'interno del tuo browser — nessun dato delle immagini viene mai inviato a un server. Usa le funzioni di pre-elaborazione (miglioramento del contrasto, scala di grigi, binarizzazione) per migliorare la precisione su immagini di bassa qualità.
Come si usa
Seleziona un'immagine
Trascina e rilascia, clicca per selezionare o incolla dagli appunti (Ctrl+V). Seleziona le caselle di controllo delle lingue di destinazione prima dell'elaborazione.
Regola la pre-elaborazione
Nella scheda "Pre-elaborazione", regola il contrasto, la soglia di binarizzazione e la scala di grigi per migliorare la precisione. Quindi clicca su "Estrai testo".
Copia o salva i risultati
Il testo estratto viene visualizzato nella scheda "Risultato". Modificalo se necessario, quindi copialo negli appunti o salvalo come file TXT UTF-8.
Glossario
- OCR (Riconoscimento Ottico dei Caratteri)
- Tecnologia che riconosce automaticamente il testo in immagini o documenti scansionati e lo converte in testo digitale modificabile. I moderni motori OCR sfruttano l'apprendimento profondo (deep learning) per un'elevata precisione.
- Tesseract.js
- Una libreria JavaScript che esegue il motore OCR open source Tesseract di Google nel browser tramite WebAssembly. Supporta oltre 100 lingue. Non è richiesto alcun server.
- WebAssembly (WASM)
- Un formato di istruzioni binarie che consente di eseguire codice nativo (C/C++/Rust) a velocità quasi nativa nel browser. Consente a compiti intensivi dal punto di vista computazionale come l'OCR di essere eseguiti sul lato client.
- Binarizzazione
- Conversione di ogni pixel in bianco o nero in base a un valore di soglia. L'applicazione della binarizzazione a immagini con basso contrasto tra testo e sfondo può migliorare significativamente la precisione dell'OCR.
- Punteggio di affidabilità
- Una metrica dallo 0 al 100% che indica quanto il motore OCR sia fiducioso nel suo risultato di riconoscimento. Valori più alti indicano risultati più affidabili. Si consiglia la revisione manuale quando è inferiore al 70%.
FAQ
- Q.Le mie immagini vengono inviate a un server?
- No. Tesseract.js (WebAssembly) funziona interamente all’interno del tuo browser. Nessun dato dell’immagine viene trasmesso. Solo il modello linguistico viene scaricato da un CDN al primo utilizzo.
- Q.Qual è la precisione per il testo in giapponese?
- Per testi stampati chiari, aspettati una precisione dell'85–95%. La pre-elaborazione (contrasto, binarizzazione) può migliorarla. I caratteri scritti a mano hanno una precisione significativamente inferiore.
- Q.Quali lingue sono supportate?
- Supporta 5 lingue: giapponese, inglese, cinese semplificato, coreano e spagnolo. Puoi anche riconoscere più lingue contemporaneamente.
- Q.Perché il primo caricamento è lento?
- Il modello linguistico (circa 15 MB per il giapponese) viene scaricato da un CDN al primo utilizzo. Dopodiché, viene memorizzato nella cache del browser: gli utilizzi successivi si caricheranno all’istante.
- Q.Può riconoscere la scrittura a mano?
- Tesseract.js è ottimizzato per il testo stampato. L’accuratezza del riconoscimento della scrittura a mano è limitata. Per un OCR di scrittura a mano ad alta precisione, considera Google Docs o servizi specializzati.
- Q.Posso estrarre il testo direttamente da un PDF?
- I PDF non sono supportati. Scatta uno screenshot o esporta la pagina PDF come immagine PNG/JPEG, quindi usa questo strumento.
Casi d’uso
Digitalizzazione di documenti
Estrai testo da contratti o report scansionati per creare documenti digitali ricercabili.
Insegne e menu in viaggio
Estrai testo da insegne o menu in lingua straniera per incollarlo in un'app di traduzione.
Estrazione del testo dagli screenshot
Estrai testo da PDF non copiabili, video, screenshot di messaggi di errore o documenti protetti.
Libri di testo e appunti di studio
Estrai testo da foto di libri di testo o materiali di studio per incollarlo in appunti digitali.
Digitalizzazione di biglietti da visita
Estrai nomi, aziende e informazioni di contatto dalle foto dei biglietti da visita per aggiungerli alla tua rubrica.
Ricerca e archiviazione
Estrai testo da immagini di vecchi documenti o materiali di ricerca per creare un archivio digitale.
Invia feedback
Facci sapere la tua opinione per aiutarci a migliorare lo strumento.
Il feedback è temporaneamente sospeso
Il server è occupato o la protezione antispam è attiva. Riprova più tardi.