Scanner App (Bild OCR)
Ziehen Sie Text per Web-Interpreter sekundenschnell aus Screens und Notizen.
100% In-Browser Verarbeitung — Ohne Datenerfassung oder Cloud-Registrierung.
Uploadfenster anklicken
oder Bild per Drag&Drop werfen
Erlaubt sind gängige Bilder wie JPEG, PNG, WebP (~30MB max)
📋 Profi-Tipp: Direkter Copy-Paste Einsatz (STRG+V) für Screenshots
Über das Tool
Das Tool "Bild OCR" (Optical Character Recognition) ist ein kostenloses Werkzeug, um schnell Text aus Fotos, Screenshots oder gescannten Dokumenten zu extrahieren.
Die Technik basiert auf Tesseract.js (WebAssembly), einer bewährten Open-Source-OCR-Engine von Google. Deutsch, Englisch, Spanisch und weitere Sprachen werden unterstützt.
Ihre Daten bleiben sicher: Es werden keine Daten an externe Server gesendet. Im Vorverarbeitungsbereich können Sie den Kontrast erhöhen und eine Schwarz-Weiß-Binarisierung anwenden, um die Erkennungsgenauigkeit deutlich zu verbessern.
Bedienung
Visuelles Material bereitstellen
Laden Sie ein Bild per Drag & Drop oder über die Schaltfläche hoch. Sie können auch einen Screenshot direkt einfügen (STRG+V / CMD+V). Wählen Sie anschließend die Quellsprache aus.
Fokus setzen (Preprocessing)
Nutzen Sie in der Bildvorschau die Regler für Kontrast und Binarisierung (Schwarz-Weiß-Umwandlung), um die OCR-Erkennung bei verrauschten oder schwach belichteten Vorlagen zu optimieren. Dann starten Sie den Scan.
Der nackte Klartext
Das Ergebnis steht im Tab bereit. Sie können den erkannten Text bearbeiten und anschließend über die Kopier-Funktion in Ihr Dokument einfügen.
Glossar
- OCR Konzept (Optical Character Recognition)
- Ein Oberbegriff aus der Pionierzeit der Scanner. Hierbei suchen Netzwerke nicht nach "Farben", sondern gleichen geometrische Muster harter Linienzüge ab, um die Abbildung in den ASCII Buchstaben "A, B, C" zu formen.
- Tesseract Machine Engine
- Eines der verlässlichsten Backbones für Deep Learning, von Hewlett-Packard entworfen und von Alphabet (Google) seit Dekaden ins Open-Source Portfolio umgemünzt. Akzeptiert weltweit dutzende Schriftdialekte.
- WASM Architektur (WebAssembly Modul)
- Aufgrund der schwachen Performance historischer Javascripts erlaubt es die moderne WASM Brücke, maschinen-nahen und rasanten C++/Rust Code extrem potent innerhalb des normalen Standard-Browsers auszuführen.
- Binarisierung
- Eine Konvertierung, die alle Grau- und Farbtöne entfernt. Nach Überschreiten eines Schwellenwerts wird jeder Pixel auf reines #000000 (Schwarz) oder #FFFFFF (Weiß) gesetzt. So entstehen kontrastreiche Vorlagen, die die OCR-Erkennung auf schwierigen Dokumenten verbessern.
- Confidence Wertung (Sicherheitscode)
- Ein statistischer Rückgabewert von 0–100%. Dieser Wert zeigt an, wie sicher die Engine mit dem erkannten Text ist. Liegt der Wert unter 40%, sollten Sie jedes Wort sorgfältig auf Fehler überprüfen.
FAQ
- Q.Werden meine Foto-Dokumente auf Fremdserver übertragen?
- Absolut Nein. Tesseract.js (unsere WebAssembly Schnittstelle) arbeitet zu einhundert Prozent passiv innerhalb des Arbeitsspeichers in Ihrem Browserfenster. Lediglich das linguistische Wörterbuch-Paket (Language Model) muss beim Erstaufruf von einem CDN geladen werden.
- Q.Wie treffsicher ist die künstliche Intelligenz bei feinen Texten?
- Bei klaren und kontraststarken Computerschriften (Typeset) dürfen Sie 85–95% Passgenauigkeit erwarten. Sie können in dem Tab "Vorauswertung" durch Justierung von Kontrasten und Schwellenwerten die Treffsicherheit nochmal steigern!
- Q.Können alte handschriftliche Dokumente oder Sütterlin erkannt werden?
- Dieses Tesseract OCR wurde sehr spartanisch auf getippte Digital-Texte kalibriert. Der Erfolg bei flüssiger Handschrift wird gering ausfallen, wir raten hierfür eher zu Diensten wie der Google-Lens API.
- Q.Welche Sprachpakete sind derzeitig inkludiert?
- Wir decken 5 riesige Sprachräume ab: Deutschsprachig (DE), Englisches Layout (EN), Vereinfachtes Chinesisch, Koreanisch, und Spanische Strukturen (inkl. Akzente).
- Q.Wieso hängt das Programm beim ersten Durchlauf für einige Sekunden?
- Der Computer muss ein gigantisches maschinelles Intelligenz-Paket (etwa 15MB Gewichtung pro Setup) über das Netz bei Erstnutzung laden. Diese Modelle liegen danach dauerhaft in Ihrem Browser-Cache bereit für rasante Offline-Arbeit.
- Q.Lässt sich Text auch direkt aus importierten PDF-Büchern lesen?
- PDF-Container blocken wir in diesem Tool ab. Trick: Machen Sie simpel und unkompliziert Bildschirmfotos (Screenshots) der PDF, und fügen Sie diese (STRG+V) als Bild ein.
Anwendungen
Analoges zu Digitalem verweben
Der Vertrag wurde vom Amt leider postalisch als Brief retourniert? Fotografieren sie die Paragraphen, um sie abzuspeichern oder abermals in E-Mails zu packen.
Rettung bei fremdsprachigen Displays
Sie sehen am PC einen fremden Clip, auf welchem ein spanisches Plakat aufpoppt. Machen sie via SnipingTool den Snapshot, filtern das Spanisch und speisen den Satz in Google Translate.
Unkopierbare Web-Phänomene knacken
Bestimmte Foren, alte Flash-Plattformen oder passwortgeschützte Office-PDF Dokumente sperren die Maus. Ein Screenshot mit folgendem OCR-Durchlauf hebt diese Barrieren restlos auf!
Flüssige Exzerpte für Studenten
Fotografieren Sie Zitate aus der Uni-Bibliothek ab, lassen die Bilder via OCR in Microsoft Word überspülen und erfreuen sich an sofort einsatzbereiten Literaturverweisen.
Elektronische Visitenkarten-Organisation
Auf Messen prasseln Visitenkarten ein. Schnappen Sie die Karte per Lens, werfen das JPEG hier hinein und kopieren sofort Telefonnummern und Titel in das Salesforce CRM.
Feedback senden
Bitte teilen Sie uns Ihre Gedanken mit, um das Tool zu verbessern.
Feedback ist vorübergehend ausgesetzt
Der Server ist ausgelastet oder der Spam-Schutz ist aktiv. Bitte versuchen Sie es später erneut.