全角半角変換ツール
(カタカナ・英数字)
全角英数字・半角カタカナ・全角スペースなどの
表記揺れを一括正規化します。
※入力内容はブラウザ内で処理され、サーバーに送信されません。
⚙️ 詳細オプション ▼
差分表示(Myers diff)
変換前
変換後
このツールについて
日本語テキストに含まれる全角英数字・半角カタカナ・全角スペースなどの「揺れ」を一括で正規化するツールです。フォーム入力の前処理、データクレンジング、原稿校正など、多様な場面で活用できます。
5つのプリセット(フォーム入力向け、英数字半角化、カナ全角化、全ひらがな化、全カタカナ化)に加え、英数字・記号・スペース・カナ幅・カナ種類の個別設定、改行統一・行末空白削除・タブ変換などの詳細オプションを搭載。差分ハイライト表示で変更箇所を視覚的に確認できます。
すべての処理はブラウザ内で完結し、データが外部サーバーに送信されることはありません。会員登録・インストール不要で、テキストを貼り付けるだけですぐに正規化を開始できます。
使い方
テキストを入力する
正規化したいテキストを入力欄に貼り付けます。フォーム入力、CSV、原稿などあらゆるテキストに対応しています。
プリセット・オプション
「自動更新」ONで詳細オプションを調整するか、プリセットを選択してください。
結果をコピー
正規化されたテキストと差分ハイライト結果を確認してコピー・保存します。
用語集
- 半角カナ → 全角カナ変換
- 「アイウエオ」のようなスマートフォンの古いメール等で使われていた半角カタカナを、「アイウエオ」という標準的な全角カタカナに一括変換する機能です。
- 全角英数字 → 半角英数字変換
- 「123ABC」のような幅の広い文字を、「123ABC」とシステムで扱いやすい標準の半角文字に変換します。データベース登録前のクレンジングで必須です。
- 文字の正規化 (Unicode Normalization)
- 見た目は同じでも内部データが違う文字(例:「が」=1文字と、「か」+「゛」=2文字)を、Unicode標準の統一された形式(NFC 等)に揃える処理技術です。
- 機種依存文字 (環境依存文字)
- 丸囲み数字やローマ数字など、一部の環境(古いWindowsやMac)でしか正しく表示されない文字。Web上での文字化けの原因になりやすいため、代替文字に変換することが推奨されます。
- 表記揺れ (Inconsistent Spelling)
- 一つの文章内で「引っ越し」「引越」「引越し」など、同じ言葉に対して違う書き方が混ざっている状態。これを解消することで検索精度や読みやすさが向上します。
- トリム (Trim) / 空白除去
- 文章の無駄なスペースを削除する処理。「全角スペースを半角スペースへ変換」「連続するスペースを1つに統合」「行頭・行末のスペースを削除」などの正規化を行います。
- 形態素解析
- 日本語の文章を単語(名詞、動詞等)の最小単位に分解する技術。本ツールでは形態素解析は使わず、文字コードに基づく高速な正規表現置換で正規化を行います。
技術解説
文字コード変換の仕組み
全角↔半角の変換はUnicodeコードポイントのオフセット計算で実装しています。全角英数字は半角との差が0xFEE0で固定されているため、加減算だけで高速に変換できます。
カナ変換のアルゴリズム
半角カナ→全角カナの変換にはUnicode正規化(NFKC)を利用しています。濁点付きの半角カナ(例:ガ)は2文字ですが、NKFCにより1文字の全角(ガ)に結合されます。
差分表示(Myers diff)
変更前後の差分計算にはMyers diffアルゴリズムを採用し、文字単位で削除(赤)と挿入(緑)を算出してハイライトします。
活用シーン
フォーム入力の前処理
データベースに格納する前のバリデーション工程に最適です。
CSVクレンジング
全角半角の混在やスペースの不統一を解消し集計精度を向上。
原稿・記事の校正
差分表示で変更箇所を目視確認でき、校正効率が大幅に向上。
プログラム前処理
ユーザー入力を処理する前に全角半角を統一してマッチング。
FAQ
- Q.セキュリティは大丈夫ですか?
- はい、テキストの変換処理はすべてお使いのPC(ブラウザ上のJavaScript)でローカルに実行されています。入力した内容が外部サーバーに送信・保存されることは一切ありません。
- Q.Excelの顧客データをコピーして変換できますか?
- はい。Excelやスプレッドシートの列をコピーしてテキストエリアに貼り付け、変換後にそのままコピーしてシートに戻す使い方が非常に便利です。
- Q.全角スペースを半角スペースにしたくありません。
- 設定パネルの「全角スペースを半角に変換」などのチェックボックスをオフにすることで、用途に応じて変換ルールを細かくカスタマイズ可能です。
- Q.「㌔」や「㈱」などの文字は変換されますか?
- 一部の組み文字(㍻など)を対応する標準文字(平成など)に開く変換など、高度なUnicode正規化機能に対応しています(オプションで設定)。
- Q.「か」+半角濁点「゙」は「が」になりますか?
- はい。濁点・半濁点が別文字として分離している不自然なデータを、結合された1文字の全角カタカナ・ひらがな(が、パ等)に自動結合・変換する機能が備わっています。
- Q.どんな時にこのツールを使えばいいですか?
- 応募フォームから集まったデータのクレンジング、古いシステムのデータの引越し、ECサイトへの商品登録前の一括テキスト整備などに最適です。
- Q.数万文字の長い文章でも変換できますか?
- はい、最適化された高速な正規表現エンジンを使用しているため、数万文字レベルのテキストでも一瞬で正規化処理が完了します。