digtools
🔍
image ocr,

OCR d'Image (Reconnaissance de Texte)

Basculez des écrits photographiés vers un format textuel sélectionnable via WebAssembly. Moteur 100% exécuté localement, sans abonnement, totalement gratuit.

🔒
100% Privé
Les images ne quittent jamais votre appareil
🌐
OCR japonais pris en charge
5 langues dont le japonais
Boost de prétraitement
Améliorez la précision avec le contraste et la binarisation
Entièrement basé sur le navigateur — Les images ne sont jamais envoyées à un serveur
Language:
🔍

Propulsez votre image ici
(Ou appuyez manuellement)

Limites souples de 30 Mo et divers protocoles.

📋 CTRL+V (Le Coller direct) s'avère hautement recommandé.

about,

Aperçu

L'outil « Reconnaissance de texte OCR d'images » est un outil en ligne gratuit qui lit le texte de photos et de captures d'écran dans votre navigateur et l'extrait sous forme de texte modifiable.

Il utilise Tesseract.js (version WebAssembly), qui exécute le moteur OCR Tesseract leader de l'industrie de Google directement dans le navigateur. Il prend en charge 5 langues, dont le japonais, l'anglais, le chinois simplifié, le coréen et l'espagnol.

Tout le traitement s'exécute dans un Web Worker à l'intérieur de votre navigateur — aucune donnée d'image n'est jamais envoyée à un serveur. Utilisez les fonctionnalités de prétraitement (amélioration du contraste, niveaux de gris, binarisation) pour améliorer la précision sur les images de faible qualité.

how to,

Comment utiliser

ÉTAPE 1

Sélectionner une image

Glissez-déposez, cliquez pour sélectionner ou collez depuis le presse-papiers (Ctrl+V). Sélectionnez les cases à cocher de la langue cible avant le traitement.

ÉTAPE 2

Ajuster le prétraitement

Dans l'onglet 'Prétraitement', ajustez le contraste, le seuil de binarisation et les niveaux de gris pour améliorer la précision. Cliquez ensuite sur 'Extraire le texte'.

ÉTAPE 3

Copier ou Enregistrer

Le texte extrait apparaît dans l'onglet 'Résultat'. Modifiez-le si nécessaire, puis copiez-le dans le presse-papiers ou enregistrez-le en tant que fichier TXT UTF-8.

glossary,

Glossaire

OCR (Optical Character Recognition)
Technologie qui reconnaît automatiquement le texte dans des images ou des documents numérisés et le convertit en texte numérique modifiable. Les moteurs OCR modernes exploitent le deep learning pour une haute précision.
Tesseract.js
Une bibliothèque JavaScript qui exécute le moteur OCR open-source Tesseract de Google dans le navigateur via WebAssembly. Prend en charge plus de 100 langues. Aucun serveur requis.
WebAssembly (WASM)
Un format d'instruction binaire qui permet d'exécuter du code natif (C/C++/Rust) à une vitesse quasi-native dans le navigateur. Permet aux tâches gourmandes en calcul comme l'OCR de s'exécuter côté client.
Binarisation
Conversion de chaque pixel en noir ou en blanc selon une valeur seuil. L'application de la binarisation aux images présentant un faible contraste entre le texte et l'arrière-plan peut considérablement améliorer la précision de l'OCR.
Score de Confiance
Une mesure de 0 à 100 % indiquant la confiance du moteur OCR dans son résultat de reconnaissance. Des valeurs plus élevées indiquent des résultats plus fiables. Un examen manuel est recommandé en dessous de 70 %.
faq,

FAQ

Q.Mes images sont-elles envoyées à un serveur ?
Non. Tesseract.js (WebAssembly) s'exécute entièrement dans votre navigateur. Aucune donnée d'image n'est transmise. Seul le modèle de langage est téléchargé depuis un CDN lors de la première utilisation.
Q.Quelle est la précision du texte japonais ?
Pour un texte imprimé clair (composé), attendez-vous à une précision de 85 à 95 %. Un prétraitement (contraste, binarisation) peut améliorer cela. Les caractères manuscrits ont une précision nettement inférieure.
Q.Quelles langues sont prises en charge ?
Il prend en charge 5 langues : japonais, anglais, chinois simplifié, coréen et espagnol. Vous pouvez également reconnaître plusieurs langues simultanément.
Q.Pourquoi le premier chargement est-il lent ?
Le modèle linguistique (environ 15 Mo pour le japonais) est téléchargé à partir d'un CDN lors de la première utilisation. Après cela, il est mis en cache dans le navigateur : les utilisations suivantes se chargent instantanément.
Q.Peut-il reconnaître l'écriture manuscrite ?
Tesseract.js est optimisé pour le texte imprimé. La précision de la reconnaissance de l’écriture manuscrite est limitée. Pour une OCR d'écriture manuscrite de haute précision, pensez à Google Docs ou à des services spécialisés.
Q.Puis-je extraire du texte directement à partir d’un PDF ?
Les PDF ne sont pas pris en charge. Prenez une capture d'écran ou exportez d'abord la page PDF sous forme d'image PNG/JPEG, puis utilisez cet outil.
use cases,

Cas d'utilisation

📄

Numérisation de documents

Extrayez du texte de contrats ou de rapports numérisés pour créer des documents numériques interrogeables.

📸

Panneaux et menus en voyage

Extrayez le texte de panneaux ou de menus en langue étrangère pour le coller dans une application de traduction.

💻

Extraction de texte de capture d'écran

Extrayez le texte de PDF, vidéos, captures d'écran de messages d'erreur ou documents verrouillés non copiables.

🎓

Manuels et notes d'étude

Extrayez le texte de photos de manuels scolaires ou de supports d'étude pour le coller dans des notes numériques.

🏢

Numérisation des cartes de visite

Extrayez les noms, entreprises et coordonnées des photos de cartes de visite pour les ajouter à votre carnet d'adresses.

🔬

Recherche et archivage

Extrayez le texte d'images d'anciens documents ou de matériaux de recherche pour créer des archives numériques.

Envoyer des commentaires

Faites-nous part de vos réflexions pour nous aider à améliorer l'outil.

Avis Légal

Les outils fournis sur ce site sont entièrement gratuits, mais veuillez les utiliser à vos propres risques. Nous ne garantissons ni l'exactitude, ni l'exhaustivité, ni la sécurité des résultats de calcul, de conversion ou des données générées. L'exploitant décline toute responsabilité pour tout dommage ou problème causé par l'utilisation de ces outils. La plupart des outils traitent les fichiers et les calculs localement dans votre navigateur, ce qui signifie que vos données saisies ne sont ni envoyées ni stockées sur nos serveurs.