亂碼修復與編碼轉換器
立即修復亂碼 (Mojibake)。
基於瀏覽器的文字編碼轉換器。
要還原的文字
文字修復完成後,您可以試試這些工具
亂碼修復工具總覽
這款免費的線上工具只需貼上亂碼文字,就能自動將其還原為原始、可讀的格式。無論您是因為在 Windows 和 Mac 之間傳輸檔案而收到亂碼,或是從舊系統中萃取出損壞的資料,這款工具都能立即解決文字編碼問題。
它會自動偵測並測試 UTF-8、Shift_JIS (SJIS / CP932)、EUC-JP 和 ISO-2022-JP 之間的所有轉換模式,然後呈現最自然、連貫的結果 — 省去您手動猜測字元編碼的麻煩。
所有還原處理都在您的瀏覽器內進行。您的敏感資料(包含機密文件和客戶資訊)絕不會傳輸或儲存到任何外部伺服器。無需安裝軟體、建立帳號或登入 — 安全且兼具隱私,非常適合日常商務使用。
為什麼會發生亂碼?常見原因解析
字元編碼不符是根本原因
在電腦上,所有文字資料都儲存為一連串的數字 (位元組 — 0 和 1)。將這些數字對應到人類可讀字元的規則手冊被稱為「字元編碼」 (例如 UTF-8 或 Shift_JIS)。
例如,同一個日文字元「あ」在 UTF-8 和 Shift_JIS 中由完全不同的位元組值表示。如果寄件者使用 Shift_JIS 儲存檔案,但收件者的軟體錯誤地將其當作 UTF-8 開啟,位元組就會被用錯誤的規則手冊解釋 — 螢幕上就會顯示出亂碼。這就是亂碼 (Mojibake)。
常見的亂碼模式
- UTF-8 被誤讀為 Shift_JIS:
網路上最常見的亂碼類型。您會看到不熟悉的漢字(如「繧」、「縺」和「繝」)出現在冗長、無意義的字串中。這通常發生在用舊版 Windows 軟體開啟 Mac 上建立的檔案時。 - Shift_JIS 被誤讀為 UTF-8:
大多數的字元會被替換為「」(帶有問號的黑色菱形) 或實際的「?」標記。如果在發生此替換後儲存了文字,原始位元組資料將永久遺失,導致無法完全還原。
使用方法
貼上亂碼文字
將您要解碼的亂碼文字貼到上方的輸入區域。您也可以直接將編碼損壞的文字檔案 (.txt, .csv) 拖放到工具中。
選擇正確的結果
系統會在背景自動測試數十種編碼轉換模式。瀏覽結果並尋找帶有「★ 推薦」徽章的結果 — 它表示這是最自然易讀的日文。
複製或嘗試手動轉換
點擊正確還原結果上的「複製」按鈕,將乾淨的文字儲存到您的剪貼簿。如果自動偵測沒有產生正確的結果,請使用「手動編碼轉換」面板自行指定確切的編碼配對。
名詞解釋
- 亂碼 (Mojibake)
- 一種錯誤現象,即建立和儲存文字檔案所用的字元編碼,與開啟和讀取它所用的編碼不相符,導致字元顯示為亂碼、無意義的符號 (例如「縺ゅ>縺」)。需要字元代碼轉換工具來還原正確的編碼。
- UTF-8
- 現代網際網路和作業系統中最廣泛採用的字元編碼標準(Unicode 的一種變體)。它可以同時處理幾乎所有語言的字元,但經常被較舊的 Windows 軟體誤讀為 Shift_JIS,從而導致亂碼。
- Shift_JIS (SJIS / CP932)
- 日本語特有的舊版字元編碼,廣泛用於較舊的 Windows 作業系統環境。在僅支援 Shift_JIS 的應用程式(例如舊版 Excel)中開啟現代 UTF-8 文字,會產生獨特的「縺」亂碼模式。
- EUC-JP / ISO-2022-JP
- EUC-JP 曾常用於舊版 Linux 和 Unix 伺服器。ISO-2022-JP(也稱為 JIS 編碼)是早期日本電子郵件通訊的標準。兩者在與現代系統介接時,仍然是產生亂碼的來源。
- 編碼
- 根據特定的字元編碼標準(例如 UTF-8 或 Shift_JIS),將人類可讀的文字轉換為位元組序列(數位資料)的過程,以便電腦可以儲存和處理。
- 解碼
- 反向過程:根據字元編碼規則手冊,將位元組資料轉換回人類可讀的文字。如果在解碼期間應用了錯誤的規則手冊,螢幕上就會出現亂碼。
常見問題
- Q.我的文字會被傳送到伺服器嗎?
- 不會。所有處理都完全在您的瀏覽器中進行。資料絕不會傳送或儲存到任何外部伺服器,因此解碼機密工作電子郵件非常安全。
- Q.我可以修復 CSV 檔案的亂碼嗎?
- 可以。拖放亂碼的 CSV 檔案或透過「載入檔案」按鈕選擇它。使用此工具還原後,在文字編輯器中將其儲存為帶有 BOM 的 UTF-8,這樣就能在 Excel 中正確開啟。
- Q.為什麼有些文字無法還原?
- 如果亂碼文字以破壞性格式 (如 ANSI/Windows-1252) 重新儲存,遺失的位元組資訊將永久遺失。不可逆的亂碼無法在數學上修復,儘管此工具會嘗試估算其中的部分內容。
- Q.像 'UTF-8 → Shift_JIS' 這樣的模式代表什麼意思?
- 它代表導致亂碼的「錯誤」:原始文件以 'UTF-8' 儲存,但您使用的軟體錯誤地假設它是 'Shift_JIS' 來開啟。
- Q.我該如何知道哪個輸出結果才是正確的?
- 此工具會顯示來自所有常見編碼組合的嘗試結果。只需捲動輸出面板,並以視覺方式找出日文字元變成連貫、易讀句子的區塊即可。
- Q.這可以修復常見的「縺」亂碼問題嗎?
- 可以。出現像「縺」這樣的字元是 UTF-8 文字被錯誤地當作 Shift_JIS 開啟的標誌。我們的工具可以輕鬆地將其轉換回正確的日文。
- Q.它可以還原變成問號 (?) 的表情符號嗎?
- 通常不行。如果軟體不支援表情符號,並用實際的 '?' 或 '□' 字元覆寫了 4 位元組字元,原始資料就已經被破壞且無法還原。
- Q.我該如何防止團隊發生亂碼問題?
- 確保所有團隊成員將其文字編輯器、IDE、資料庫和 CSV 匯出設定為使用通用的 'UTF-8' 標準,以完全消除編碼不符的問題。
使用場景
以下是發生亂碼的最常見情況,以及實用的解決方案。
在 Excel 中開啟時 CSV 檔案變亂碼
當您在 Windows Excel 中點擊兩下開啟 UTF-8 編碼的 CSV 檔案(例如,從 Web 應用程式匯出)時,Excel 可能會嘗試將其讀取為 Shift_JIS,從而導致亂碼。
解決方案: 將檔案拖放到此工具中以進行還原,或使用 Excel 的「資料」索引標籤 →「從文字/CSV」匯入精靈,並將 UTF-8 指定為檔案原始編碼。
收到的電子郵件無法閱讀
當寄件者的電子郵件用戶端使用較舊的編碼(如 ISO-2022-JP 或 EUC-JP),但收件者的郵件軟體(Outlook、Gmail 等)嘗試將其當作 UTF-8 處理時,就會發生這種情況。
解決方案: 複製整個亂碼的電子郵件內文,並將其貼上到此工具的輸入區域,以解碼並還原原始訊息。
Mac 和 Windows 之間的 ZIP 檔案名稱變亂碼
在 Windows 上使用內建解壓縮程式解壓縮在 Mac 上建立的 ZIP 檔案時,檔案名稱可能會變成亂碼。這是因為 Mac 以 UTF-8 儲存檔案名稱,而 Windows 會嘗試將其解釋為 Shift_JIS。
解決方案: 使用可識別 UTF-8 的解壓縮工具(如 7-Zip),或在 Mac 端使用相容於 Windows 的壓縮公用程式。
整個網站在瀏覽器中顯示為亂碼
當 HTML 檔案的中繼標記 (charset 宣告) 與檔案儲存時的實際編碼不相符時,就會發生這種情況。
解決方案: 使用瀏覽器擴充功能手動變更文字編碼,或是網站管理員需要更正 HTML 中的 charset 宣告。
亂碼復原演算法的運作方式 (技術細節)
透過 TextDecoder API 進行安全的瀏覽器原生處理
為了還原亂碼,此工具利用了現代瀏覽器內建的 TextEncoder 和 TextDecoder API。它會從輸入的亂碼文字中萃取字碼點,並在所有支援的編碼之間執行位元組轉換和重新解碼 — 完全在用戶端進行。
這表示不會有任何資料傳送到外部伺服器,使得修復過程極為安全且快速。
暴力破解自動偵測與評分
針對任何給定的輸入,工具會在背景非同步執行數十種轉換測試:
- 單階段轉換 (19 種模式): 涵蓋因單一編碼誤判而造成的所有常見亂碼 (例如,資料實際上是 UTF-8,但卻被當作 Shift_JIS 開啟)。
- 多階段 / 雙重亂碼 (10 種模式): 處理資料經過多個系統並被錯誤轉換兩次或多次的複雜情況 (例如,SJIS → CP1252 → UTF-8 連鎖損壞)。
每個結果都會使用專有演算法進行評分,該演算法會評估日文字元(平假名、片假名、常用漢字)的頻率、ASCII 字元的比例,以及損壞的替換字元 (? 或 ) 的普遍程度。得分最高的結果 — 被視為最「自然的日文」 — 將獲得「★ 推薦」徽章。
Send Feedback
Please let us know your thoughts to help us improve the tool.
Feedback is temporarily suspended
The server is busy or spam protection is active. Please try again later.