digtools
⚙️
unicode-normalizer,

修復Mac濁音分離
(Unicode正規化)

在瀏覽器中即時修復Mac特有的檔案名稱濁音分離(か゛き゛)。

⚡️
貼上即可即時修復
一鍵解決濁音分離
✨️
完美對應Mac濁音問題
自動將NFD轉換為NFC
🛡️
無需外部函式庫
僅使用瀏覽器標準功能即可運作
字數: 0 | 偵測到NFD: 0
about,

概要

這是一個能即時執行Unicode文字正規化(NFC/NFD/NFKC/NFKD)的線上工具。您可以輕鬆進行文字編碼統一或比較時所需的正規化處理。

支援文字處理中常見的正規化模式,例如全半形統一、濁音結合/分解、相容字元正規化等。同時也提供文字碼位(Code Point)與位元組顯示功能。

所有的處理皆在瀏覽器內完成,資料不會傳送到伺服器。

how to use,

使用方法

STEP 1

輸入文字

在輸入框中輸入或貼上想要正規化的文字。

STEP 2

選擇格式

選擇NFC、NFD、NFKC或NFKD其中一種正規化格式。

STEP 3

確認結果與複製

確認正規化後的文字與碼位變化,並進行複製。

glossary,

術語集

Unicode正規化
相同的文字有不同的Unicode表示方式,將其統一的處理。有NFC・NFD・NFKC・NFKD這4種格式。
NFC(正規合成)
將分解的文字整合為結合後文字的正規化格式。在網頁及一般文字處理中最廣泛使用。
NFD(正規分解)
將文字分解為基底字元與結合字元的正規化格式。macOS的檔案系統即採用此格式。
NFKC(相容合成)
將相容字元(全形英數或半形片假名等)轉換為標準格式後再進行合成的正規化格式。
結合字元
單獨無法表達意義,須附加於前一個基底字元上的Unicode字元。例如重音符號或濁音符號等。
相容字元
外觀或意義相似但具有不同碼位的文字。例如全形空白、全形英數、圓圈數字等。
碼位 (Code Point)
Unicode中分配給每個文字的唯一編號。通常表示為U+3042,用於識別文字。
faq,

FAQ

NFC與NFKC有什麼不同?
NFC會在不改變外觀的情況下統一內部表示。NFKC則會進一步將全形英數轉為半形等,將相容字元也轉換為標準格式。
我應該使用哪種格式?
一般文字處理適用NFC,資料庫或搜尋前處理則適用NFKC。如果需要與macOS相容,則可以考慮使用NFD。
文字會傳送至伺服器嗎?
不會。所有的處理皆在瀏覽器內完成。您輸入的文字不會傳送到外部伺服器。
正規化會導致文字消失嗎?
通常不會消失。但在NFKC中,全形文字會被轉為半形等,外觀可能會改變。
為什麼在字串比較時需要正規化?
即使是相同的文字,如果內部編碼不同也會導致比較失敗。正規化可統一表示方式,確保能正確比對一致。
對日文文字特別有效嗎?
是的。對於混雜全半形假名與英數的日文文件,透過正規化可消除表記的差異,並提升資料品質。
如何複製結果?
點擊轉換結果右上方的複製按鈕,即可將文字儲存至剪貼簿中。
use cases,

應用場景

🗄️

資料庫統一

透過正規化使用者輸入的資料,確保資料的統一性。

🔍

字串比較

使用正規化後的字串來實現精確的比較與搜尋。

📊

文字前處理

作為自然語言處理或資料分析前處理的一部分進行正規化。

🔧

字元編碼調查

確認文字的碼位,協助調查編碼相關的問題。

technology,

技術解說

String.prototype.normalize() API

因為只使用瀏覽器原生的內建函式,所以即便是龐大的字串資料,也能在幾毫秒內即時完成正規化。

Send Feedback

Please let us know your thoughts to help us improve the tool.

免責聲明

本網站提供的所有工具均可免費使用,但請用戶自行承擔使用風險。本網站對各種工具的計算結果、轉換結果及生成數據的準確性、完整性和安全性不作任何保證。因使用本工具而產生的任何損害或糾紛,運營者概不負責,敬請見諒。此外,檔案處理與計算等操作原則上均在您的瀏覽器內完成,您輸入的數據不會傳送或保存在本網站的伺服器上。