Macの濁点分離を修正
(Unicode正規化)
Mac特有のファイル名の濁点分離(か゛き゛)を
ブラウザで即座に修復します。
🔍 詳細分析(コードポイント表示)
概要
Unicodeテキストの正規化(NFC/NFD/NFKC/NFKD)をリアルタイムで実行するオンラインツールです。文字コードの統一や比較に必要な正規化処理を簡単に行えます。
全角・半角の統一、濁点の結合/分解、互換文字の正規化など、テキスト処理で頻出する正規化パターンに対応。文字のコードポイント表示やバイト列表示も可能です。
すべての処理はブラウザ内で完結し、データがサーバーに送信されることはありません。
使い方
テキストを入力する
正規化したいテキストを入力欄に入力またはペーストします。
形式を選択する
NFC、NFD、NFKC、NFKDのいずれかの正規化形式を選択します。
結果を確認・コピー
正規化後のテキストとコードポイントの変化を確認し、コピーします。
用語集
- Unicode正規化
- 同じ文字を表す複数のUnicode表現を統一する処理。NFC・NFD・NFKC・NFKDの4形式があります。
- NFC(正規合成)
- 分解された文字を結合済み文字に統合する正規化形式。Webや一般的なテキスト処理で最も広く使われます。
- NFD(正規分解)
- 文字を基底文字と結合文字に分解する正規化形式。macOSのファイルシステムで採用されています。
- NFKC(互換合成)
- 互換文字(全角英数字や半角カナなど)を標準形式に変換してから合成する正規化形式。
- 結合文字
- 単独では意味を持たず、直前の基底文字に付加されるUnicode文字。アクセント記号や濁点などが該当します。
- 互換文字
- 見た目や意味が似ている別のコードポイントを持つ文字。全角スペース・全角英数字・丸囲み数字などが含まれます。
- コードポイント
- Unicodeで各文字に割り当てられた一意の番号。U+3042のように表記され、文字の識別に使用されます。
FAQ
- NFCとNFKCの違いは何ですか?
- NFCは見た目を変えずに内部表現を統一します。NFKCはさらに全角英数字を半角に変換するなど、互換文字も標準形式に変換します。
- どの形式を使えばいいですか?
- 一般的なテキストにはNFC、データベースや検索の前処理にはNFKCが適しています。macOSとの互換性が必要な場合はNFDを検討してください。
- テキストはサーバーに送信されますか?
- いいえ。すべての処理はブラウザ内で完結します。入力したテキストは外部サーバーに送信されません。
- 正規化によって文字が消えることはありますか?
- 通常は消えません。ただしNFKCでは全角文字が半角に変換されるなど、見た目が変わる場合があります。
- 文字列比較で正規化が必要な理由は?
- 同じ文字でも内部エンコードが異なると比較が失敗します。正規化することで表現を統一し、一致を確実にできます。
- 日本語テキストに特に有効ですか?
- はい。全角・半角カナや英数字が混在する日本語文書では、正規化により表記揺れを解消してデータ品質を向上できます。
- 結果をコピーするには?
- 変換結果の右上にあるコピーボタンを押すと、クリップボードにテキストが保存されます。
活用シーン
データベース統一
ユーザー入力の正規化でデータの統一性を確保。
文字列比較
正規化後の文字列で正確な比較・検索を実現。
テキスト前処理
自然言語処理やデータ分析の前処理として正規化を適用。
文字コード調査
文字のコードポイントを確認。エンコーディング問題の調査に。
技術解説
String.prototype.normalize() API
ブラウザ固有のネイティブ関数のみを用いているため、膨大な文字列データであっても数ミリ秒で即座に正規化が完了します。
フィードバックを送信
ツールをより良くするためのご意見をお聞かせください。
現在、フィードバックの受付を一時停止しています
サーバーが混み合っているか、スパム防止のための安全装置が作動しています。しばらく経ってから再度アクセスしてください。