Image OCR (Text Recognition)
Extract text from photos and screenshots in your browser.
Entièrement basé sur le navigateur — aucune donnée n'est envoyée, sans inscription.
Drag & drop an image
or click to select
JPEG, PNG, WebP, BMP supported (max 30MB)
📋 Paste from clipboard with Ctrl+V
Aperçu
The "Image OCR (Text Recognition)" tool is a free online tool that reads text from photos and screenshots in your browser and extracts it as editable text.
It uses Tesseract.js (WebAssembly version), which runs Google's industry-leading Tesseract OCR engine directly in the browser. It supports 5 languages including Japanese, English, Simplified Chinese, Korean, and Spanish.
All processing runs in a Web Worker inside your browser — no image data is ever sent to a server. Use preprocessing features (contrast enhancement, grayscale, binarization) to improve accuracy on low-quality images.
Comment utiliser
Select an Image
Drag and drop, click to select, or paste from clipboard (Ctrl+V). Select the target language checkboxes before processing.
Adjust Preprocessing
In the "Preprocessing" tab, adjust contrast, binarization threshold, and grayscale to improve accuracy. Then click "Extract Text".
Copy or Save Results
The extracted text appears in the "Result" tab. Edit if needed, then copy to clipboard or save as a UTF-8 TXT file.
Glossaire
- OCR (Optical Character Recognition)
- Technology that automatically recognizes text in images or scanned documents and converts it to editable digital text. Modern OCR engines leverage deep learning for high accuracy.
- Tesseract.js
- A JavaScript library that runs Google's open-source Tesseract OCR engine in the browser via WebAssembly. Supports 100+ languages. No server required.
- WebAssembly (WASM)
- A binary instruction format that allows running native code (C/C++/Rust) at near-native speed in the browser. Enables computationally intensive tasks like OCR to run client-side.
- Binarization
- Converting each pixel to either black or white based on a threshold value. Applying binarization to images with low contrast between text and background can significantly improve OCR accuracy.
- Confidence Score
- A 0–100% metric indicating how confident the OCR engine is in its recognition result. Higher values indicate more reliable results. Manual review is recommended when below 70%.
FAQ
- Q.Mes images sont-elles envoyées à un serveur ?
- Non. Tesseract.js (WebAssembly) s'exécute entièrement dans votre navigateur. Aucune donnée d'image n'est transmise. Seul le modèle de langage est téléchargé depuis un CDN lors de la première utilisation.
- Q.Quelle est la précision du texte japonais ?
- Pour un texte imprimé clair (composé), attendez-vous à une précision de 85 à 95 %. Un prétraitement (contraste, binarisation) peut améliorer cela. Les caractères manuscrits ont une précision nettement inférieure.
- Q.Quelles langues sont prises en charge ?
- Il prend en charge 5 langues : japonais, anglais, chinois simplifié, coréen et espagnol. Vous pouvez également reconnaître plusieurs langues simultanément.
- Q.Pourquoi le premier chargement est-il lent ?
- Le modèle linguistique (environ 15 Mo pour le japonais) est téléchargé à partir d'un CDN lors de la première utilisation. Après cela, il est mis en cache dans le navigateur : les utilisations suivantes se chargent instantanément.
- Q.Peut-il reconnaître l'écriture manuscrite ?
- Tesseract.js est optimisé pour le texte imprimé. La précision de la reconnaissance de l’écriture manuscrite est limitée. Pour une OCR d'écriture manuscrite de haute précision, pensez à Google Docs ou à des services spécialisés.
- Q.Puis-je extraire du texte directement à partir d’un PDF ?
- Les PDF ne sont pas pris en charge. Prenez une capture d'écran ou exportez d'abord la page PDF sous forme d'image PNG/JPEG, puis utilisez cet outil.
Cas d'utilisation
Numérisation de documents
Extract text from scanned contracts or reports to create searchable digital documents.
Panneaux et menus en voyage
Extract text from foreign-language signs or menus to paste into a translation app.
Extraction de texte de capture d'écran
Extract text from non-copyable PDFs, videos, error message screenshots, or locked documents.
Manuels et notes d'étude
Extract text from photos of textbooks or study materials to paste into digital notes.
Numérisation des cartes de visite
Extract names, companies, and contact info from business card photos to add to your address book.
Recherche et archivage
Extract text from images of old documents or research materials to build a digital archive.