ดึงข้อความจากรูปภาพ (OCR)
แยกข้อความจากรูปภาพและภาพหน้าจอโดยตรงบนเบราว์เซอร์
ไม่มีการอัปโหลดข้อมูลไปยังเซิร์ฟเวอร์ ปลอดภัย 100% และใช้งานได้ฟรี
ลากและวางรูปภาพที่นี่
หรือคลิกเพื่อเลือกไฟล์
รองรับ JPEG, PNG, WebP, BMP (สูงสุด 30MB)
📋 หรือวางจากคลิปบอร์ด (Ctrl+V)
เกี่ยวกับ
เครื่องมือ "ดึงข้อความจากรูปภาพ (OCR)" เป็นเครื่องมือออนไลน์ฟรีที่ช่วยให้คุณสามารถแยกข้อความจากรูปภาพหรือภาพหน้าจอได้อย่างรวดเร็วบนเบราว์เซอร์ของคุณ
ทำงานด้วยเทคโนโลยีหลัก Tesseract.js (เวอร์ชัน WebAssembly) ซึ่งนำเอนจิน OCR โอเพนซอร์สที่ทรงพลังที่สุดของ Google มาทำงานอย่างราบรื่นบนเบราว์เซอร์ รองรับ 5 ภาษายอดนิยม ได้แก่ ภาษาญี่ปุ่น ภาษาอังกฤษ ภาษาจีนตัวย่อ ภาษาเกาหลี และภาษาสเปน
กระบวนการทั้งหมดทำงานผ่าน Web Worker ภายในเบราว์เซอร์ของคุณ — ไม่มีการอัปโหลดข้อมูลรูปภาพไปยังเซิร์ฟเวอร์ภายนอกอย่างแน่นอน คุณยังสามารถใช้ฟังก์ชันการประมวลผลล่วงหน้า (เพิ่มความคมชัด การทำไบนารี การแปลงเป็นภาพระดับสีเทา) เพื่อเพิ่มความแม่นยำในการจดจำข้อความในภาพถ่ายที่มีคุณภาพต่ำ
วิธีใช้งาน
เลือกรูปภาพ
ลากและวาง คลิกเพื่อเลือกไฟล์ หรือวางรูปภาพโดยตรงจากคลิปบอร์ด (ใช้คีย์ลัด Ctrl+V) อย่าลืมเลือกภาษาของข้อความที่อยู่ในรูปภาพก่อนเริ่มต้น
การประมวลผลล่วงหน้า (ถ้าจำเป็น)
ในแท็บ "การประมวลผลล่วงหน้า" คุณสามารถปรับความคมชัด ขีดจำกัดของไบนารี หรือเปลี่ยนรูปภาพเป็นขาวดำเพื่อให้ข้อความโดดเด่นและช่วยเพิ่มความแม่นยำในการจดจำ จากนั้นคลิก "แยกข้อความ"
คัดลอกหรือบันทึก
ข้อความที่แยกได้จะปรากฏอัตโนมัติในแท็บ "ผลลัพธ์" คุณสามารถตรวจสอบ แก้ไขหากจำเป็น จากนั้นคัดลอกข้อความไปยังคลิปบอร์ดหรือบันทึกเป็นไฟล์ .TXT (มาตรฐาน UTF-8)
คำศัพท์
- OCR (Optical Character Recognition)
- การรู้จำอักขระด้วยแสง เป็นเทคโนโลยีที่สแกนและวิเคราะห์รูปร่างของอักขระบนรูปภาพหรือเอกสารที่สแกนโดยอัตโนมัติ เพื่อแปลงเป็นข้อความดิจิทัลที่สามารถแก้ไขได้
- Tesseract.js
- ไลบรารี JavaScript ที่ทรงพลังซึ่งใช้ในการรันเอนจินการจดจำข้อความ Tesseract OCR แบบโอเพนซอร์สที่พัฒนาโดย Google บนเบราว์เซอร์ผ่าน WebAssembly รองรับมากกว่า 100 ภาษาโดยไม่จำเป็นต้องเชื่อมต่อเซิร์ฟเวอร์
- WebAssembly (WASM)
- รูปแบบไบนารีที่ช่วยให้ภาษาโปรแกรมที่มีประสิทธิภาพสูง (C/C++/Rust) สามารถรันโดยตรงบนเว็บเบราว์เซอร์ด้วยความเร็วใกล้เคียงกับแอปพลิเคชันเดสก์ท็อป ทำให้การประมวลผลที่ใช้ทรัพยากรมากอย่าง OCR เป็นไปได้บนเบราว์เซอร์
- การทำไบนารี (Binarization)
- กระบวนการแปลงพิกเซลทั้งหมดของรูปภาพให้เป็นสีขาวและดำเท่านั้น ตามค่าขีดจำกัดที่กำหนด มีประโยชน์อย่างยิ่งในการจัดการรูปภาพที่เบลอหรือมีความคมชัดระหว่างข้อความและพื้นหลังต่ำ
- ความน่าเชื่อถือ (Confidence Score)
- คะแนนประเมินจาก 0-100% แสดงถึงระดับความเชื่อมั่นของเอนจินการจดจำต่อผลลัพธ์ ยิ่งคะแนนสูง ข้อมูลยิ่งมีความแม่นยำ ควรตรวจสอบเนื้อหาอีกครั้งหากคะแนนต่ำกว่า 70%
FAQ
- Q.รูปภาพของฉันจะถูกส่งไปยังเซิร์ฟเวอร์หรือไม่?
- ไม่ Tesseract.js (เวอร์ชัน WebAssembly) ทำงานบนเบราว์เซอร์ของคุณทั้งหมด ไม่มีการส่งข้อมูลรูปภาพออกไป มีเพียงแพ็กเกจภาษา (Language model) เท่านั้นที่จะถูกดาวน์โหลดจาก CDN ในการใช้งานครั้งแรก
- Q.ความแม่นยำในการจดจำภาษาญี่ปุ่นคือเท่าใด?
- สำหรับข้อความที่พิมพ์อย่างชัดเจน ความแม่นยำจะอยู่ที่ 85–95% การประมวลผลล่วงหน้า (การปรับความคมชัด, การทำไบนารี) สามารถช่วยเพิ่มความแม่นยำได้ แต่สำหรับลายมือ ความแม่นยำจะลดลงอย่างมาก
- Q.เครื่องมือนี้รองรับภาษาใดบ้าง?
- รองรับ 5 ภาษา ได้แก่ ภาษาญี่ปุ่น ภาษาอังกฤษ ภาษาจีนตัวย่อ ภาษาเกาหลี และภาษาสเปน คุณสามารถเลือกจดจำหลายภาษาพร้อมกันได้
- Q.ทำไมการทำงานครั้งแรกจึงใช้เวลานาน?
- เนื่องจากโมเดลภาษา (ประมาณ 15MB สำหรับภาษาญี่ปุ่น) จำเป็นต้องดาวน์โหลดจาก CDN ในครั้งแรก หลังจากนั้นข้อมูลจะถูกเก็บไว้ (cache) ในเบราว์เซอร์ของคุณ ทำให้การใช้งานครั้งต่อไปรวดเร็วทันที
- Q.สามารถจดจำลายมือได้หรือไม่?
- Tesseract.js ได้รับการปรับแต่งมาสำหรับข้อความที่พิมพ์ ความสามารถในการจดจำลายมือมีค่อนข้างจำกัด หากต้องการความแม่นยำสูงสำหรับลายมือ แนะนำให้ใช้ Google Docs หรือบริการเฉพาะทาง
- Q.ฉันสามารถแยกข้อความโดยตรงจากไฟล์ PDF ได้หรือไม่?
- ไม่รองรับไฟล์ PDF กรุณาถ่ายภาพหน้าจอหรือส่งออกหน้า PDF เป็นรูปภาพ PNG/JPEG ก่อน จากนั้นจึงใช้เครื่องมือนี้เพื่อแยกข้อความ
การใช้งาน
แปลงเอกสารเป็นดิจิทัล
แยกข้อความจากสัญญาหรือรายงานที่สแกนเป็นภาพได้อย่างง่ายดาย เพื่อจัดเก็บในรูปแบบดิจิทัลและค้นหาได้สะดวก
แปลป้ายและเมนูเมื่อท่องเที่ยว
ถ่ายภาพป้ายหรือเมนูร้านอาหารในต่างประเทศ แยกข้อความ แล้วนำไปวางในแอปแปลภาษาเพื่อความสะดวก
ดึงข้อความจากภาพหน้าจอ
แยกข้อความจากไฟล์ PDF ที่ถูกล็อกการคัดลอก คำบรรยายในวิดีโอ ข้อความแจ้งเตือนข้อผิดพลาด หรือเว็บไซต์ที่ไม่อนุญาตให้คัดลอกข้อความ
จดบันทึกการเรียน
ถ่ายภาพหน้าหนังสือเรียน สมุดจด หรือเอกสารกระดาษ เพื่อแยกข้อความแล้วนำไปจัดเก็บในแอปจัดการบันทึกดิจิทัลของคุณ
แปลงนามบัตรเป็นดิจิทัล
แยกชื่อ ตำแหน่ง ชื่อบริษัท และข้อมูลติดต่อจากภาพถ่ายนามบัตรอย่างรวดเร็วเพื่อบันทึกลงในสมุดที่อยู่บนโทรศัพท์ของคุณ
งานวิจัยและการจัดเก็บ
สแกนและแยกเนื้อหาจากหนังสือเก่าหรือเอกสารงานวิจัยที่ไม่มีไฟล์ดิจิทัล เพื่อสร้างห้องสมุดอิเล็กทรอนิกส์สำหรับจัดเก็บข้อมูล
ส่งความคิดเห็น
โปรดแจ้งให้เราทราบความคิดเห็นของคุณเพื่อช่วยปรับปรุงเครื่องมือ
การส่งความคิดเห็นถูกระงับชั่วคราว
เซิร์ฟเวอร์ไม่ว่างหรือระบบป้องกันสแปมทำงานอยู่ โปรดลองอีกครั้งในภายหลัง