⚙️
unicode-normalizer,
修復Mac濁音分離
(Unicode正規化)
在瀏覽器中即時修復
Mac特有的檔案名稱濁音分離(か゛き゛)。
⚡️
貼上即可即時修復
一鍵解決濁音分離
✨️
完美對應Mac濁音問題
自動將NFD轉換為NFC
🛡️
無需外部函式庫
僅使用瀏覽器標準功能即可運作
about,
概要
這是一個能即時執行Unicode文字正規化(NFC/NFD/NFKC/NFKD)的線上工具。您可以輕鬆進行文字編碼統一或比較時所需的正規化處理。
支援文字處理中常見的正規化模式,例如全半形統一、濁音結合/分解、相容字元正規化等。同時也提供文字碼位(Code Point)與位元組顯示功能。
所有的處理皆在瀏覽器內完成,資料不會傳送到伺服器。
how to use,
使用方法
STEP 1
輸入文字
在輸入框中輸入或貼上想要正規化的文字。
STEP 2
選擇格式
選擇NFC、NFD、NFKC或NFKD其中一種正規化格式。
STEP 3
確認結果與複製
確認正規化後的文字與碼位變化,並進行複製。
glossary,
術語集
- Unicode正規化
- 相同的文字有不同的Unicode表示方式,將其統一的處理。有NFC・NFD・NFKC・NFKD這4種格式。
- NFC(正規合成)
- 將分解的文字整合為結合後文字的正規化格式。在網頁及一般文字處理中最廣泛使用。
- NFD(正規分解)
- 將文字分解為基底字元與結合字元的正規化格式。macOS的檔案系統即採用此格式。
- NFKC(相容合成)
- 將相容字元(全形英數或半形片假名等)轉換為標準格式後再進行合成的正規化格式。
- 結合字元
- 單獨無法表達意義,須附加於前一個基底字元上的Unicode字元。例如重音符號或濁音符號等。
- 相容字元
- 外觀或意義相似但具有不同碼位的文字。例如全形空白、全形英數、圓圈數字等。
- 碼位 (Code Point)
- Unicode中分配給每個文字的唯一編號。通常表示為U+3042,用於識別文字。
faq,
FAQ
- NFC與NFKC有什麼不同?
- NFC會在不改變外觀的情況下統一內部表示。NFKC則會進一步將全形英數轉為半形等,將相容字元也轉換為標準格式。
- 我應該使用哪種格式?
- 一般文字處理適用NFC,資料庫或搜尋前處理則適用NFKC。如果需要與macOS相容,則可以考慮使用NFD。
- 文字會傳送至伺服器嗎?
- 不會。所有的處理皆在瀏覽器內完成。您輸入的文字不會傳送到外部伺服器。
- 正規化會導致文字消失嗎?
- 通常不會消失。但在NFKC中,全形文字會被轉為半形等,外觀可能會改變。
- 為什麼在字串比較時需要正規化?
- 即使是相同的文字,如果內部編碼不同也會導致比較失敗。正規化可統一表示方式,確保能正確比對一致。
- 對日文文字特別有效嗎?
- 是的。對於混雜全半形假名與英數的日文文件,透過正規化可消除表記的差異,並提升資料品質。
- 如何複製結果?
- 點擊轉換結果右上方的複製按鈕,即可將文字儲存至剪貼簿中。
use cases,
應用場景
🗄️
資料庫統一
透過正規化使用者輸入的資料,確保資料的統一性。
🔍
字串比較
使用正規化後的字串來實現精確的比較與搜尋。
📊
文字前處理
作為自然語言處理或資料分析前處理的一部分進行正規化。
🔧
字元編碼調查
確認文字的碼位,協助調查編碼相關的問題。
technology,
技術解說
String.prototype.normalize() API
因為只使用瀏覽器原生的內建函式,所以即便是龐大的字串資料,也能在幾毫秒內即時完成正規化。
Send Feedback
Please let us know your thoughts to help us improve the tool.
Feedback sent successfully. Thank you for your cooperation!
An error occurred. Please try again later.
Feedback is temporarily suspended
The server is busy or spam protection is active. Please try again later.