digtools
🔤
mojibake fixer,

Sửa lỗi Font chữ (Mojibake)

Công cụ dựa trên trình duyệt giúp giải mã và sửa chữa lỗi font chữ ngay lập tức.

🔒️
Xử lý 100% tại trình duyệt
Dữ liệu không được gửi đến máy chủ
✨️
Không cần đăng ký
Sẵn sàng sử dụng ngay lập tức
⚡️
Khôi phục tức thì
Dán văn bản để chuyển đổi

Văn bản cần khôi phục

0 Ký tự
Thả tệp để tải
about,

Tổng quan về Công cụ sửa lỗi Font chữ

Công cụ này là một công cụ trực tuyến miễn phí giúp tự động khôi phục dữ liệu văn bản bị lỗi font chữ (Mojibake) và không thể đọc được thành văn bản gốc chính xác chỉ bằng cách dán nó vào. Nó giải quyết ngay lập tức sự cố lỗi font chữ xảy ra khi trao đổi tệp giữa các hệ điều hành khác nhau như Windows và Mac, hoặc khi trích xuất dữ liệu từ các hệ thống cũ.

Tự động xác minh và đánh giá hàng loạt tất cả các mẫu chuyển đổi mã hóa giữa UTF-8, Shift_JIS (SJIS / CP932), EUC-JP và ISO-2022-JP, đồng thời trình bày kết quả có ý nghĩa nhất. Giúp bạn tiết kiệm rắc rối khi đoán mã ký tự và thử chuyển đổi từng cái một theo cách thủ công.

Ngoài ra, tất cả các quá trình khôi phục chỉ được thực hiện bên trong thiết bị của bạn (máy tính hoặc trình duyệt của điện thoại thông minh). Dữ liệu bí mật hoặc thông tin khách hàng đã nhập không bao giờ được gửi hoặc lưu trữ trên máy chủ bên ngoài. Không cần thủ tục rườm rà như cài đặt phần mềm, đăng ký thành viên hay đăng nhập, bạn có thể yên tâm sử dụng cho công việc mà vẫn giữ được tính an toàn và riêng tư.

cause,

Tại sao xảy ra lỗi font chữ? Nguyên nhân và Cơ chế

Nguyên nhân do không khớp mã hóa ký tự (Encoding)

Trên máy tính, tất cả dữ liệu văn bản được lưu trữ dưới dạng chuỗi số 0 và 1 (chuỗi byte). Bảng quy tắc chuyển đổi chuỗi số này thành các ký tự mà con người có thể đọc được gọi là Mã hóa ký tự (Character Encoding).

Ví dụ: đối với cùng một ký tự, các số được gán trong bảng mã UTF-8 và bảng mã Shift_JIS là khác nhau. Nếu người nhận hiểu nhầm dữ liệu do người gửi lưu dưới dạng 'Shift_JIS' và đọc theo quy tắc 'UTF-8', các ký tự hoàn toàn khác sẽ hiển thị trên màn hình. Đây là bản chất thực sự của lỗi font chữ (Mojibake).

Các mẫu lỗi font chữ phổ biến

  • Lỗi do đọc sai UTF-8 thành Shift_JIS:
    Đây là lỗi phổ biến nhất trên Web. Nó được đặc trưng bởi một chuỗi các ký tự và biểu tượng lạ. Hiện tượng này thường xảy ra khi mở tệp được tạo trên Mac bằng phần mềm Windows cũ.
  • Lỗi do đọc sai Shift_JIS thành UTF-8:
    Đây là hiện tượng trong đó hầu hết các ký tự được thay thế bằng các ký tự thay thế (Replacement Character) như hình thoi màu đen có dấu chấm hỏi. Nếu nó được lưu đè bằng các ký tự thay thế, dữ liệu byte gốc sẽ bị mất và khó khôi phục lại hoàn toàn.
how to,

Cách sửa và sử dụng

BƯỚC 1

Nhập văn bản bị lỗi font chữ

Dán chuỗi bị lỗi font chữ cần giải mã vào vùng nhập liệu phía trên. Bạn cũng có thể thả trực tiếp các tệp văn bản (.txt, .csv, v.v.) bị hỏng mã hóa để đọc.

BƯỚC 2

Chọn văn bản đúng từ kết quả

Cùng lúc với việc nhập liệu, hàng chục mẫu chuyển đổi mã hóa được tự động xác minh và liệt kê ở chế độ nền. Vui lòng tìm kiếm kết quả có gắn huy hiệu '★ Khuyên dùng', là kết quả có ý nghĩa tự nhiên nhất.

BƯỚC 3

Sao chép kết quả / Chuyển đổi thủ công

Nhấp vào nút "Sao chép" trong khối kết quả đã được khôi phục chính xác để lưu lại văn bản. Nếu khôi phục tự động không hoạt động, bạn có thể thử khôi phục bằng cách chỉ định mã hóa mong muốn từ "Chuyển đổi mã hóa thủ công".

glossary,

Thuật ngữ về Lỗi font chữ

Lỗi font chữ (Mojibake)
Hiện tượng lỗi trong đó mã hóa ký tự (encoding) không khớp giữa môi trường tạo/lưu văn bản và môi trường mở/đọc tệp, khiến ký tự được hiển thị thành một chuỗi ký hiệu và ký tự ngẫu nhiên vô nghĩa. Cần khôi phục về mã hóa chính xác bằng công cụ.
UTF-8
Mã hóa ký tự quốc tế phổ biến nhất (một loại Unicode) cho internet và hệ thống trên toàn thế giới ngày nay. Có khả năng xử lý ký tự nhiều ngôn ngữ đồng thời, nhưng thường bị hiểu sai thành Shift_JIS trên môi trường Windows cũ, gây ra lỗi font chữ.
Shift_JIS (SJIS / CP932)
Mã hóa ký tự đặc thù của tiếng Nhật đã được sử dụng từ lâu trong hệ điều hành Windows. Khi mở chuỗi UTF-8 mới nhất được tạo trên máy Mac trong môi trường SJIS cũ như Excel, lỗi font chữ đặc trưng sẽ xảy ra.
EUC-JP / ISO-2022-JP
EUC-JP là bộ mã ký tự thường được dùng trên các máy chủ Linux hoặc UNIX cũ. Mặt khác, ISO-2022-JP (mã JIS) là mã hóa tiếng Nhật tiêu chuẩn từng được sử dụng để gửi và nhận email trước đây. Ngay cả hiện nay, nó vẫn có thể gây lỗi font chữ khi kết nối với các hệ thống cũ.
Mã hóa (Encode)
Quá trình chuyển đổi dữ liệu chuỗi có thể đọc được của con người thành dữ liệu byte (chuỗi số kỹ thuật số của 0 và 1) có thể được lưu trữ và xử lý bởi máy tính theo một quy tắc mã hóa ký tự cụ thể (chẳng hạn như UTF-8 hoặc Shift_JIS).
Giải mã (Decode)
Quá trình đưa dữ liệu byte trên máy tính trở lại chuỗi văn bản gốc có thể đọc được của con người theo các quy tắc của mã hóa ký tự. Nếu bạn sử dụng sai quy tắc tại thời điểm giải mã này, lỗi font chữ sẽ xảy ra trên màn hình.
faq,

Câu hỏi thường gặp về lỗi hiển thị font (FAQ)

Q.Văn bản tôi nhập có bị gửi đến máy chủ không?
Không. Tất cả quá trình xử lý được hoàn tất trong trình duyệt và dữ liệu không bao giờ được gửi hay lưu trữ trên máy chủ.
Q.Tôi có thể sửa lỗi phông chữ trong tệp CSV không?
Có. Bạn có thể khôi phục bằng cách kéo thả tệp CSV bị lỗi hoặc chọn từ nút Tải tệp. Sau khi khôi phục, hãy lưu dưới dạng UTF-8 với BOM bằng trình soạn thảo văn bản để mở trong Excel mà không bị lỗi.
Q.Tại sao một số lỗi phông chữ không thể được khôi phục?
Nếu dữ liệu bị mất một phần không thể đảo ngược (ví dụ: được lưu bằng 'Windows-1252' và các ký tự thay thế được chèn vào), rất khó để khôi phục hoàn toàn văn bản gốc.
Q.Mẫu như 'UTF-8 → Shift_JIS' là gì?
Nó chỉ ra [lịch sử hiểu sai gây ra lỗi font chữ], trong đó dữ liệu ban đầu được tạo bằng 'UTF-8' nhưng phần mềm mở nó lại hiểu nhầm là 'Shift_JIS'.
Q.Làm sao tôi biết kết quả khôi phục nào là đúng?
Công cụ này tính toán tất cả các kết hợp của các mẫu chuyển đổi sai phổ biến và hiển thị dưới dạng danh sách. Vui lòng tự tìm văn bản có 'ý nghĩa nhất bằng tiếng Nhật (hoặc ngôn ngữ của bạn)' từ danh sách.
Q.Có thể sửa lỗi phông chữ như '縺ゅ>縺' không?
Có. Việc bao gồm '縺' là một mẫu lỗi điển hình khi 'tiếng Nhật được lưu bằng UTF-8 được mở bằng Shift_JIS', và công cụ này có thể khôi phục nó với xác suất rất cao.
Q.Lỗi biểu tượng cảm xúc (trở thành ? hoặc □) có sửa được không?
Rất tiếc, nếu bản thân dữ liệu đã bị ghi đè không thể đảo ngược thành '?' thông qua một hệ thống cũ không hỗ trợ biểu tượng cảm xúc, nó không thể được sửa chữa bằng công cụ khôi phục.
Q.Làm thế nào để tôi có thể ngăn ngừa lỗi font chữ?
Cách tốt nhất là thống nhất mã hóa ký tự thành tiêu chuẩn thế giới 'UTF-8' khi tạo và lưu tệp, và yêu cầu người nhận mở nó bằng UTF-8.
use cases,

Các trường hợp lỗi font phổ biến và cách giải quyết

Dưới đây là một số trường hợp lỗi font chữ (Mojibake) phổ biến mà bạn thường gặp trong công việc hoặc đời sống cá nhân, cùng với các giải pháp cho chúng.

📂

Tệp CSV mở trong Excel bị lỗi font chữ

Nếu bạn nhấp đúp để mở dữ liệu CSV định dạng UTF-8 được tải xuống từ hệ thống Web trong Windows Excel, lỗi font chữ sẽ xảy ra vì Excel cố gắng đọc nó dưới dạng Shift_JIS.

Giải pháp: Thả tệp vào công cụ này để khôi phục, hoặc nhập từ tab 'Dữ liệu' của Excel -> 'Từ Văn bản/CSV' và chỉ định mã ký tự là 'UTF-8' để hiển thị chính xác.

📧

Email nhận được bị lỗi font và không đọc được

Điều này xảy ra khi người gửi gửi email bằng mã hóa cũ như 'ISO-2022-JP' (mã JIS) hoặc 'EUC-JP', và ứng dụng thư của người nhận (Outlook, Gmail, v.v.) cố gắng xử lý nó dưới dạng UTF-8.

Giải pháp: Bạn có thể giải mã và khôi phục văn bản gốc bằng cách sao chép toàn bộ văn bản bị lỗi font chữ và dán vào vùng nhập của công cụ này.

🗜️

Lỗi font tên tệp khi giải nén ZIP giữa Mac/Windows

Nếu bạn giải nén tệp ZIP được nén trên máy Mac bằng chức năng tiêu chuẩn của Windows, tên tệp có thể bị lỗi font chữ. Điều này là do Mac lưu tên tệp bằng UTF-8, trong khi Windows cố gắng giải nén dưới dạng Shift_JIS.

Giải pháp: Bạn có thể ngăn chặn điều này bằng cách sử dụng phần mềm giải nén hỗ trợ UTF-8 như 7-Zip, hoặc bằng cách sử dụng công cụ nén tương thích với Windows khi nén trên máy Mac.

🌐

Toàn bộ trang web bị lỗi font trên trình duyệt

Điều này xảy ra khi thẻ meta (thẻ charset) của tệp HTML và mã ký tự thực tế mà tệp được lưu không khớp.

Giải pháp: Bạn cần thay đổi mã hóa văn bản theo cách thủ công bằng tiện ích mở rộng của trình duyệt web hoặc quản trị viên trang web phải sửa chính xác mã ký tự HTML.

technology,

Thuật toán khôi phục lỗi font chữ (Giải thích công nghệ)

Xử lý an toàn bằng API TextDecoder gốc của trình duyệt

Để khôi phục văn bản bị lỗi font chữ, công cụ này sử dụng tối đa các API TextEncoderTextDecoder được tích hợp tiêu chuẩn trong các trình duyệt hiện đại. Lấy các code point của từng ký tự từ văn bản bị lỗi font chữ mà người dùng đã nhập, đồng thời quá trình chuyển đổi byte và giải mã lại theo từng mã hóa được chỉ định được hoàn tất hoàn toàn trên phía máy khách (Client-side).

Điều này cho phép khôi phục và giải mã văn bản bị lỗi font chữ cực kỳ an toàn và tốc độ cao mà không phải gửi bất kỳ dữ liệu nào đến máy chủ bên ngoài.

Đánh giá tự động và chấm điểm bằng cách thử nghiệm toàn diện (Brute Force)

Đối với văn bản đã nhập, công cụ sẽ thực thi bất đồng bộ tất cả hàng chục mẫu kiểm tra chuyển đổi bên trong.

  • Chuyển đổi một bước (19 mẫu): Xác minh và khôi phục một cách tổng hợp các lỗi font chữ thông thường xảy ra do lỗi diễn giải mã ký tự 1 lần (ví dụ: dữ liệu vốn là UTF-8 bị hiểu sai thành Shift_JIS).
  • Chuyển đổi nhiều bước / Lỗi font chữ kép (10 mẫu): Cũng cố gắng khôi phục lỗi font chữ phức tạp trong đó đã xảy ra từ 2 lỗi chuyển đổi trở lên (chẳng hạn như dữ liệu bị hỏng liên tiếp như SJIS → CP1252 → UTF-8) thông qua nhiều hệ thống.

Đối với tất cả các mẫu kết quả chuyển đổi, thuật toán riêng sẽ chấm điểm tần suất xuất hiện của tiếng Nhật (bao nhiêu Hiragana, Katakana và Kanji thông dụng được bao gồm), tỷ lệ ký tự ASCII và tỷ lệ hòa trộn của các ký tự không hợp lệ như ký tự thay thế (? hoặc ) hoặc ký tự điều khiển. Kết quả có điểm cao nhất và được đánh giá là gần với "tiếng Nhật tự nhiên nhất" sẽ được gắn huy hiệu "★ Khuyên dùng" và hiển thị cho người dùng.

Tất cả danh mục

Gửi phản hồi

Vui lòng cho chúng tôi biết suy nghĩ của bạn để giúp chúng tôi cải thiện công cụ.

Tuyên bố miễn trách nhiệm

Các công cụ được cung cấp trên trang web này hoàn toàn miễn phí, nhưng vui lòng sử dụng theo rủi ro của riêng bạn. Chúng tôi không đảm bảo về độ chính xác, đầy đủ hoặc an toàn của bất kỳ kết quả tính toán, kết quả chuyển đổi hoặc dữ liệu được tạo ra nào. Xin lưu ý rằng người vận hành không chịu trách nhiệm về bất kỳ thiệt hại hoặc sự cố nào gây ra bởi việc sử dụng các công cụ này. Hầu hết các công cụ xử lý tệp và tính toán ngay trong trình duyệt của bạn, nghĩa là dữ liệu bạn nhập không được gửi hoặc lưu trữ trên máy chủ của chúng tôi.