OCR de Imagem (Reconhecimento de Texto)
Extraia texto de fotos e capturas de tela no seu navegador.
Tudo local — as imagens nunca são enviadas ao servidor.
Arraste e solte uma imagem
ou clique para selecionar
JPEG, PNG, WebP, BMP (máx. 30MB)
📋 Cole da área de transferência com Ctrl+V
Sobre
A ferramenta "OCR de Imagem (Reconhecimento de Texto)" é uma ferramenta online gratuita que lê o texto de fotos e capturas de tela no seu navegador e o extrai como texto editável.
Utiliza Tesseract.js (versão WebAssembly), que executa o motor OCR Tesseract do Google diretamente no navegador. Compatível com 5 idiomas: japonês, inglês, chinês simplificado, coreano e português.
Todo o processamento é executado em um Web Worker dentro do navegador — nenhum dado de imagem é enviado a nenhum servidor. Use as funções de pré-processamento (contraste, escala de cinza, binarização) para melhorar a precisão em imagens de baixa qualidade.
Como Usar
Enviar uma Imagem
Arraste e solte, clique para selecionar ou cole da área de transferência (Ctrl+V). Selecione os idiomas desejados antes de processar.
Ajustar Pré-processamento
Na aba "Pré-processamento", ajuste o contraste, o limiar de binarização e a escala de cinza para melhorar a precisão. Clique em "Extrair Texto".
Copiar ou Salvar
O texto extraído aparece na aba "Resultado". Edite se necessário, copie para a área de transferência ou baixe como arquivo TXT UTF-8.
Glossário
- OCR (Reconhecimento Óptico de Caracteres)
- Tecnologia que reconhece automaticamente o texto em imagens ou documentos digitalizados e o converte em texto digital editável. Os motores OCR modernos usam deep learning para alta precisão.
- Tesseract.js
- Biblioteca JavaScript que executa o motor OCR Tesseract do Google no navegador via WebAssembly. Compatível com mais de 100 idiomas. Não requer servidor.
- Binarização
- Conversão de cada pixel para branco ou preto com base em um valor limiar. Aplicar binarização em imagens com baixo contraste entre texto e fundo pode melhorar significativamente a precisão do OCR.
- Pontuação de Confiança
- Métrica de 0 a 100% que indica o quanto o motor OCR está seguro sobre seu resultado. Recomenda-se revisão manual quando está abaixo de 70%.
- WebAssembly (WASM)
- Formato de instrução binária que permite executar código nativo a velocidade quase nativa no navegador. Permite que tarefas computacionalmente intensas como o OCR rodem no lado do cliente.
FAQ
- P.Minhas imagens são enviadas a algum servidor?
- Não. O Tesseract.js (WebAssembly) roda completamente dentro do navegador. Nenhum dado de imagem é transmitido. Apenas o modelo de idioma é baixado de uma CDN no primeiro uso.
- P.Qual a precisão do reconhecimento de texto em japonês?
- Para texto impresso claro (tipografia), espera-se uma precisão de 85-95%. O pré-processamento (contraste, binarização) pode melhorar isso. Caracteres manuscritos têm precisão significativamente menor.
- P.Quais idiomas são suportados?
- Suporta 5 idiomas: japonês, inglês, chinês simplificado, coreano e português. Você também pode reconhecer vários idiomas simultaneamente.
- P.Por que o primeiro carregamento é lento?
- O modelo de idioma (aprox. 15MB para japonês) é baixado de uma CDN no primeiro uso. Depois é armazenado em cache no navegador, tornando os usos posteriores instantâneos.
- P.Pode reconhecer escrita à mão?
- O Tesseract.js é otimizado para texto impreso. A precisão do reconhecimento de escrita à mão é limitada. Para OCR de alta precisão em manuscritos, considere Google Docs ou outros serviços especializados.
- P.Posso extrair texto diretamente de um PDF?
- PDFs não são compatíveis. Faça uma captura de tela ou exporte a página do PDF como imagem PNG/JPEG primeiro e depois use esta ferramenta.
Casos de Uso
Digitalizar Documentos
Extraia texto de contratos ou relatórios digitalizados para criar documentos digitais pesquisáveis.
Cartazes e Menus em Viagens
Extraia texto de cartazes ou menus em idiomas estrangeiros para colar em um app de tradução.
Texto de Capturas de Tela
Extraia texto de PDFs sem copiar, vídeos, mensagens de erro ou documentos bloqueados.
Livros Didáticos
Extraia texto de fotos de livros didáticos ou material de estudo para colar em notas digitais.
Digitalização de Cartões
Extraia nomes, empresas e dados de contato de fotos de cartões de visita.
Pesquisa e Arquivos
Extraia texto de imagens de documentos antigos ou materiais de pesquisa para criar um arquivo digital.