이미지가 서버로 전송되나요?

아니요. Tesseract.js(WebAssembly)가 브라우저 내에서 작동하기 때문에 이미지 데이터가 네트워크로 전송되지 않습니다. 단, 언어 인식 모델을 처음 다운로드할 때만 CDN 통신이 발생합니다.

한국어 인식 정확도는 어느 정도인가요?

선명한 인쇄 텍스트(활자)라면 85~95% 정도의 정확도를 기대할 수 있습니다. 전처리(대비 강조, 이진화)를 활용하면 정확도를 더 높일 수 있습니다. 손글씨 인식 정확도는 제한적입니다.

지원하는 언어는 무엇인가요?

한국어, 영어, 일본어, 중국어(간체), 스페인어 등 5개 언어를 지원합니다. 여러 언어를 동시에 인식하는 것도 가능합니다.

처음 불러올 때 시간이 오래 걸리는 이유는 무엇인가요?

처음 이용 시 언어 인식 모델(한국어의 경우 약 15MB)을 CDN에서 다운로드하기 때문입니다. 다운로드 후에는 브라우저에 캐시되므로 두 번째부터는 바로 이용할 수 있습니다.

손글씨도 인식할 수 있나요?

Tesseract.js는 주로 인쇄 텍스트에 최적화되어 있어 손글씨 인식 정확도는 낮습니다. 손글씨의 고정밀 OCR을 원하시면 Google Docs 등의 전용 서비스를 이용해 주십시오.

PDF에서 직접 텍스트를 추출할 수 있나요?

PDF는 지원하지 않습니다. PDF를 스크린샷이나 PNG 이미지로 저장한 후 이용해 주십시오.

🔍

image ocr,

이미지 OCR (문자 인식) 툴

사진이나 스크린샷에서 문자를 읽어 텍스트로 변환.
서버 전송 없이 모두 브라우저 내에서 안전하게 처리.

🔒

서버 전송 없음

이미지는 기기 밖으로 나가지 않습니다

🌐

다국어 OCR

한국어를 포함한 5개 언어 지원

⚡

전처리로 정확도 향상

대비 및 이진화로 인식률 향상

완전 브라우저 처리 — 이미지가 서버로 전송되지 않습니다 (언어 모델만 CDN 통신 있음)

🔍

이미지를 드래그 앤 드롭
또는 클릭하여 선택

JPEG・PNG・WebP・BMP 지원 (최대 30MB)

📋 Ctrl+V 로 클립보드에서 붙여넣기 가능

about,

개요

'이미지 OCR(문자 인식) 툴'은 사진이나 스크린샷에 찍힌 텍스트를 브라우저 내에서 읽어내어 편집 가능한 텍스트로 추출할 수 있는 무료 온라인 툴입니다.

OCR(광학 문자 인식) 엔진으로 Tesseract.js(WebAssembly 버전)를 채택했습니다. 이 엔진은 Google이 개발한 세계 최고 수준의 OCR 엔진을 웹 브라우저에서 실행시킨 것으로, 한국어·영어·일본어·중국어(간체)·스페인어 등 5개 언어를 지원합니다.

모든 처리는 브라우저 내의 Web Worker에서 이루어지므로 이미지 데이터가 서버로 전송되는 일은 일절 없습니다. 대비 강조, 그레이스케일 변환, 이진화 등의 전처리를 결합하여 저화질 이미지에서도 인식 정확도를 높일 수 있습니다.

how to,

사용법

STEP 1

이미지 불러오기

문자를 읽을 이미지를 드래그 앤 드롭하거나 클릭하여 선택, 또는 Ctrl+V로 클립보드에서 붙여넣습니다. 인식하려는 언어를 미리 선택해 두세요.

STEP 2

전처리로 정확도 향상

'전처리' 탭에서 대비·이진화·그레이스케일을 조정하면 인식 정확도가 향상됩니다. 조정 후 '문자 읽기' 버튼을 누릅니다. 문자가 선명한 경우에는 조정할 필요가 없습니다.

STEP 3

텍스트 복사 및 저장

'인식 결과' 탭에 추출된 텍스트가 표시됩니다. 편집도 가능합니다. 복사 버튼으로 클립보드에 복사하거나 TXT 파일로 저장할 수 있습니다.

glossary,

용어집

OCR (광학 문자 인식, Optical Character Recognition): 이미지나 스캔된 문서에 포함된 텍스트를 자동으로 인식하여 편집 가능한 디지털 텍스트로 변환하는 기술입니다. 최근에는 딥러닝을 활용한 고정밀 OCR 엔진이 보급되고 있습니다.
Tesseract.js: Google이 개발한 오픈 소스 OCR 엔진인 'Tesseract'를 WebAssembly를 통해 브라우저 상에서 작동시킨 JavaScript 라이브러리입니다. 100개 이상의 언어 모델을 지원하며 서버 없이 OCR 처리를 실행할 수 있습니다.
WebAssembly (WASM): 브라우저에서 C/C++/Rust 등으로 작성된 네이티브 코드를 실행하기 위한 기술입니다. JavaScript보다 빠른 처리가 가능하며, OCR과 같은 계산 집약적인 처리의 브라우저 내 실행을 구현합니다.
이진화 (Binarization): 이미지의 각 픽셀을 흰색 또는 검은색의 2가지 값으로 변환하는 처리입니다. 그레이스케일 값이 임계값 이상이면 흰색, 미만이면 검은색으로 만듭니다. 배경과 문자의 대비가 낮은 이미지에 적용하면 OCR 정확도가 크게 향상될 수 있습니다.
신뢰도 (Confidence Score): OCR 엔진이 각 문자를 어느 정도의 확신으로 인식했는지를 0~100%로 나타내는 지표입니다. 값이 높을수록 인식 결과의 신뢰성이 높습니다. 70% 미만인 경우 수동으로 확인 및 수정하는 것을 권장합니다.

faq,

FAQ

Q.이미지가 서버로 전송되나요?: 아니요. Tesseract.js(WebAssembly)가 브라우저 내에서 작동하기 때문에 이미지 데이터가 네트워크로 전송되지 않습니다. 단, 언어 인식 모델을 처음 다운로드할 때만 CDN 통신이 발생합니다.
Q.한국어 인식 정확도는 어느 정도인가요?: 선명한 인쇄 텍스트(활자)라면 85~95% 정도의 정확도를 기대할 수 있습니다. 전처리(대비 강조, 이진화)를 활용하면 정확도를 더 높일 수 있습니다. 손글씨 인식 정확도는 제한적입니다.
Q.지원하는 언어는 무엇인가요?: 한국어, 영어, 일본어, 중국어(간체), 스페인어 등 5개 언어를 지원합니다. 여러 언어를 동시에 인식하는 것도 가능합니다.
Q.처음 불러올 때 시간이 오래 걸리는 이유는 무엇인가요?: 처음 이용 시 언어 인식 모델(한국어의 경우 약 15MB)을 CDN에서 다운로드하기 때문입니다. 다운로드 후에는 브라우저에 캐시되므로 두 번째부터는 바로 이용할 수 있습니다.
Q.손글씨도 인식할 수 있나요?: Tesseract.js는 주로 인쇄 텍스트에 최적화되어 있어 손글씨 인식 정확도는 낮습니다. 손글씨의 고정밀 OCR을 원하시면 Google Docs 등의 전용 서비스를 이용해 주십시오.
Q.PDF에서 직접 텍스트를 추출할 수 있나요?: PDF는 지원하지 않습니다. PDF를 스크린샷이나 PNG 이미지로 저장한 후 이용해 주십시오.

use cases,

활용 사례

📄

서류 및 보고서의 디지털화

스캔한 서류나 계약서의 문자를 추출하여 디지털 텍스트화합니다. 검색 가능한 데이터로 저장 및 관리할 수 있습니다.

📸

간판 및 메뉴판 문자 읽기

여행지에서 촬영한 간판이나 외국어 메뉴판의 문자를 추출하여 번역 앱에 붙여넣습니다.

💻

스크린샷에서 복사 및 붙여넣기

복사가 불가능한 PDF, 동영상 스크린샷, 오류 메시지 이미지에서 문자를 추출합니다.

🎓

교과서 및 참고서의 텍스트화

교과서나 참고서의 페이지 사진에서 문자를 추출하여 학습 노트에 적습니다. 효율적인 학습을 지원합니다.

🏢

명함의 디지털화

명함 사진에서 성명, 회사명, 연락처를 추출하여 주소록에 등록합니다. 명함 관리를 효율화합니다.

🔬

연구 및 아카이브 작업

오래된 문헌 및 자료의 이미지에서 문자를 추출하여 디지털 아카이브를 구축합니다. 연구 및 조사 효율화에 기여합니다.

이미지 OCR (문자 인식) 툴

개요

사용법

이미지 불러오기

전처리로 정확도 향상

텍스트 복사 및 저장

용어집

FAQ

활용 사례

서류 및 보고서의 디지털화

간판 및 메뉴판 문자 읽기

스크린샷에서 복사 및 붙여넣기

교과서 및 참고서의 텍스트화

명함의 디지털화

연구 및 아카이브 작업

관련 도구

사진 메타데이터(EXIF) 뷰어 및 제거기

맞춤법 및 띄어쓰기 검사기

음성 → 텍스트 변환(STT)

글자 수 세기

증명사진 메이커

피사계 심도 계산기

도안 메이커

배경화면 달력 만들기

오리카·TCG 제작기

모든 카테고리

피드백 보내기

Feedback is temporarily suspended

면책 조항