digtools
🔍
image ocr,

Image OCR (Text Recognition)

Extract text from photos and screenshots in your browser. Entièrement basé sur le navigateur — aucune donnée n'est envoyée, sans inscription.

🔒
100% Privé
Les images ne quittent jamais votre appareil
🌐
OCR japonais pris en charge
5 langues dont le japonais
Boost de prétraitement
Améliorez la précision avec le contraste et la binarisation
Entièrement basé sur le navigateur — Les images ne sont jamais envoyées à un serveur
Language:
🔍

Drag & drop an image
or click to select

JPEG, PNG, WebP, BMP supported (max 30MB)

📋 Paste from clipboard with Ctrl+V

about,

Aperçu

The "Image OCR (Text Recognition)" tool is a free online tool that reads text from photos and screenshots in your browser and extracts it as editable text.

It uses Tesseract.js (WebAssembly version), which runs Google's industry-leading Tesseract OCR engine directly in the browser. It supports 5 languages including Japanese, English, Simplified Chinese, Korean, and Spanish.

All processing runs in a Web Worker inside your browser — no image data is ever sent to a server. Use preprocessing features (contrast enhancement, grayscale, binarization) to improve accuracy on low-quality images.

how to,

Comment utiliser

STEP 1

Select an Image

Drag and drop, click to select, or paste from clipboard (Ctrl+V). Select the target language checkboxes before processing.

STEP 2

Adjust Preprocessing

In the "Preprocessing" tab, adjust contrast, binarization threshold, and grayscale to improve accuracy. Then click "Extract Text".

STEP 3

Copy or Save Results

The extracted text appears in the "Result" tab. Edit if needed, then copy to clipboard or save as a UTF-8 TXT file.

glossary,

Glossaire

OCR (Optical Character Recognition)
Technology that automatically recognizes text in images or scanned documents and converts it to editable digital text. Modern OCR engines leverage deep learning for high accuracy.
Tesseract.js
A JavaScript library that runs Google's open-source Tesseract OCR engine in the browser via WebAssembly. Supports 100+ languages. No server required.
WebAssembly (WASM)
A binary instruction format that allows running native code (C/C++/Rust) at near-native speed in the browser. Enables computationally intensive tasks like OCR to run client-side.
Binarization
Converting each pixel to either black or white based on a threshold value. Applying binarization to images with low contrast between text and background can significantly improve OCR accuracy.
Confidence Score
A 0–100% metric indicating how confident the OCR engine is in its recognition result. Higher values indicate more reliable results. Manual review is recommended when below 70%.
faq,

FAQ

Q.Mes images sont-elles envoyées à un serveur ?
Non. Tesseract.js (WebAssembly) s'exécute entièrement dans votre navigateur. Aucune donnée d'image n'est transmise. Seul le modèle de langage est téléchargé depuis un CDN lors de la première utilisation.
Q.Quelle est la précision du texte japonais ?
Pour un texte imprimé clair (composé), attendez-vous à une précision de 85 à 95 %. Un prétraitement (contraste, binarisation) peut améliorer cela. Les caractères manuscrits ont une précision nettement inférieure.
Q.Quelles langues sont prises en charge ?
Il prend en charge 5 langues : japonais, anglais, chinois simplifié, coréen et espagnol. Vous pouvez également reconnaître plusieurs langues simultanément.
Q.Pourquoi le premier chargement est-il lent ?
Le modèle linguistique (environ 15 Mo pour le japonais) est téléchargé à partir d'un CDN lors de la première utilisation. Après cela, il est mis en cache dans le navigateur : les utilisations suivantes se chargent instantanément.
Q.Peut-il reconnaître l'écriture manuscrite ?
Tesseract.js est optimisé pour le texte imprimé. La précision de la reconnaissance de l’écriture manuscrite est limitée. Pour une OCR d'écriture manuscrite de haute précision, pensez à Google Docs ou à des services spécialisés.
Q.Puis-je extraire du texte directement à partir d’un PDF ?
Les PDF ne sont pas pris en charge. Prenez une capture d'écran ou exportez d'abord la page PDF sous forme d'image PNG/JPEG, puis utilisez cet outil.
use cases,

Cas d'utilisation

📄

Numérisation de documents

Extract text from scanned contracts or reports to create searchable digital documents.

📸

Panneaux et menus en voyage

Extract text from foreign-language signs or menus to paste into a translation app.

💻

Extraction de texte de capture d'écran

Extract text from non-copyable PDFs, videos, error message screenshots, or locked documents.

🎓

Manuels et notes d'étude

Extract text from photos of textbooks or study materials to paste into digital notes.

🏢

Numérisation des cartes de visite

Extract names, companies, and contact info from business card photos to add to your address book.

🔬

Recherche et archivage

Extract text from images of old documents or research materials to build a digital archive.

Avis Légal

Les outils fournis sur ce site sont entièrement gratuits, mais veuillez les utiliser à vos propres risques. Nous ne garantissons ni l'exactitude, ni l'exhaustivité, ni la sécurité des résultats de calcul, de conversion ou des données générées. L'exploitant décline toute responsabilité pour tout dommage ou problème causé par l'utilisation de ces outils. La plupart des outils traitent les fichiers et les calculs localement dans votre navigateur, ce qui signifie que vos données saisies ne sont ni envoyées ni stockées sur nos serveurs.