OCR d'Image (Reconnaissance de Texte)
Basculez des écrits photographiés vers un format textuel sélectionnable via WebAssembly.
Moteur 100% exécuté localement, sans abonnement, totalement gratuit.
Propulsez votre image ici
(Ou appuyez manuellement)
Limites souples de 30 Mo et divers protocoles.
📋 CTRL+V (Le Coller direct) s'avère hautement recommandé.
Aperçu
L'outil « Reconnaissance de texte OCR d'images » est un outil en ligne gratuit qui lit le texte de photos et de captures d'écran dans votre navigateur et l'extrait sous forme de texte modifiable.
Il utilise Tesseract.js (version WebAssembly), qui exécute le moteur OCR Tesseract leader de l'industrie de Google directement dans le navigateur. Il prend en charge 5 langues, dont le japonais, l'anglais, le chinois simplifié, le coréen et l'espagnol.
Tout le traitement s'exécute dans un Web Worker à l'intérieur de votre navigateur — aucune donnée d'image n'est jamais envoyée à un serveur. Utilisez les fonctionnalités de prétraitement (amélioration du contraste, niveaux de gris, binarisation) pour améliorer la précision sur les images de faible qualité.
Comment utiliser
Sélectionner une image
Glissez-déposez, cliquez pour sélectionner ou collez depuis le presse-papiers (Ctrl+V). Sélectionnez les cases à cocher de la langue cible avant le traitement.
Ajuster le prétraitement
Dans l'onglet 'Prétraitement', ajustez le contraste, le seuil de binarisation et les niveaux de gris pour améliorer la précision. Cliquez ensuite sur 'Extraire le texte'.
Copier ou Enregistrer
Le texte extrait apparaît dans l'onglet 'Résultat'. Modifiez-le si nécessaire, puis copiez-le dans le presse-papiers ou enregistrez-le en tant que fichier TXT UTF-8.
Glossaire
- OCR (Optical Character Recognition)
- Technologie qui reconnaît automatiquement le texte dans des images ou des documents numérisés et le convertit en texte numérique modifiable. Les moteurs OCR modernes exploitent le deep learning pour une haute précision.
- Tesseract.js
- Une bibliothèque JavaScript qui exécute le moteur OCR open-source Tesseract de Google dans le navigateur via WebAssembly. Prend en charge plus de 100 langues. Aucun serveur requis.
- WebAssembly (WASM)
- Un format d'instruction binaire qui permet d'exécuter du code natif (C/C++/Rust) à une vitesse quasi-native dans le navigateur. Permet aux tâches gourmandes en calcul comme l'OCR de s'exécuter côté client.
- Binarisation
- Conversion de chaque pixel en noir ou en blanc selon une valeur seuil. L'application de la binarisation aux images présentant un faible contraste entre le texte et l'arrière-plan peut considérablement améliorer la précision de l'OCR.
- Score de Confiance
- Une mesure de 0 à 100 % indiquant la confiance du moteur OCR dans son résultat de reconnaissance. Des valeurs plus élevées indiquent des résultats plus fiables. Un examen manuel est recommandé en dessous de 70 %.
FAQ
- Q.Mes images sont-elles envoyées à un serveur ?
- Non. Tesseract.js (WebAssembly) s'exécute entièrement dans votre navigateur. Aucune donnée d'image n'est transmise. Seul le modèle de langage est téléchargé depuis un CDN lors de la première utilisation.
- Q.Quelle est la précision du texte japonais ?
- Pour un texte imprimé clair (composé), attendez-vous à une précision de 85 à 95 %. Un prétraitement (contraste, binarisation) peut améliorer cela. Les caractères manuscrits ont une précision nettement inférieure.
- Q.Quelles langues sont prises en charge ?
- Il prend en charge 5 langues : japonais, anglais, chinois simplifié, coréen et espagnol. Vous pouvez également reconnaître plusieurs langues simultanément.
- Q.Pourquoi le premier chargement est-il lent ?
- Le modèle linguistique (environ 15 Mo pour le japonais) est téléchargé à partir d'un CDN lors de la première utilisation. Après cela, il est mis en cache dans le navigateur : les utilisations suivantes se chargent instantanément.
- Q.Peut-il reconnaître l'écriture manuscrite ?
- Tesseract.js est optimisé pour le texte imprimé. La précision de la reconnaissance de l’écriture manuscrite est limitée. Pour une OCR d'écriture manuscrite de haute précision, pensez à Google Docs ou à des services spécialisés.
- Q.Puis-je extraire du texte directement à partir d’un PDF ?
- Les PDF ne sont pas pris en charge. Prenez une capture d'écran ou exportez d'abord la page PDF sous forme d'image PNG/JPEG, puis utilisez cet outil.
Cas d'utilisation
Numérisation de documents
Extrayez du texte de contrats ou de rapports numérisés pour créer des documents numériques interrogeables.
Panneaux et menus en voyage
Extrayez le texte de panneaux ou de menus en langue étrangère pour le coller dans une application de traduction.
Extraction de texte de capture d'écran
Extrayez le texte de PDF, vidéos, captures d'écran de messages d'erreur ou documents verrouillés non copiables.
Manuels et notes d'étude
Extrayez le texte de photos de manuels scolaires ou de supports d'étude pour le coller dans des notes numériques.
Numérisation des cartes de visite
Extrayez les noms, entreprises et coordonnées des photos de cartes de visite pour les ajouter à votre carnet d'adresses.
Recherche et archivage
Extrayez le texte d'images d'anciens documents ou de matériaux de recherche pour créer des archives numériques.
Envoyer des commentaires
Faites-nous part de vos réflexions pour nous aider à améliorer l'outil.
Les commentaires sont temporairement suspendus
Le serveur est occupé ou la protection anti-spam est active. Veuillez réessayer plus tard.