Alat konversi lebar penuh - setengah
(Katakana/Alfanumerik)
Menormalkan variasi notasi secara batch
seperti alfanumerik lebar penuh, katakana setengah lebar, dan spasi lebar penuh.
* Konten diproses di browser Anda — tidak pernah dikirim ke server.
⚙️ Opsi Lanjutan ▼
Tampilan Diff (Myers diff)
Sebelum
Sesudah
Tentang
Ini adalah alat yang menormalkan "variasi" seperti karakter alfanumerik lebar penuh, katakana setengah lebar, dan spasi lebar penuh dalam teks Jepang sekaligus. Dapat digunakan dalam berbagai situasi, seperti preprocessing input formulir, pembersihan data, dan proofreading naskah.
Selain 5 preset (untuk input formulir, alfanumerik setengah lebar, kana lebar penuh, semua hiragana, dan semua katakana), juga mencakup opsi lanjutan seperti pengaturan individual untuk alfanumerik, simbol, spasi, lebar kana, dan jenis kana, menyatukan baris baru, menghapus spasi di akhir baris, dan mengonversi tab. Anda dapat memeriksa perubahan secara visual dengan penyorotan perbedaan.
Semua pemrosesan diselesaikan dalam browser dan tidak ada data yang dikirim ke server eksternal. Tidak perlu registrasi anggota atau instalasi; cukup tempel teks dan Anda dapat mulai menormalisasi segera.
Cara Pakai
Masukkan teks
Tempel teks yang ingin Anda normalisasi ke dalam kolom input. Mendukung semua jenis teks, termasuk input formulir, CSV, dan naskah.
Opsi preset
Aktifkan "Pembaruan Otomatis" untuk menyesuaikan opsi lanjutan atau pilih preset.
Salin hasil
Periksa, salin, dan simpan teks ternormalisasi dan hasil penyorotan diferensial.
Glosarium
- Kana Setengah Lebar ke Lebar Penuh
- Mengonversi katakana Jepang setengah lebar lama ("アイウエオ") menjadi katakana lebar penuh standar ("アイウエオ"). Penting untuk keterbacaan web modern.
- Alfanumerik Lebar Penuh ke Setengah Lebar
- Mengonversi huruf dan angka Inggris lebar ("123ABC") ke format ASCII setengah lebar standar ("123ABC"). Penting untuk validasi database.
- Normalisasi Unicode (NFC/NFD)
- Proses menyatukan representasi byte internal yang berbeda dari karakter yang sama. Misalnya, memastikan "が" adalah satu karakter daripada "か" + "゛".
- Karakter Bergantung Mesin
- Glyph proprietary lama (seperti angka dalam lingkaran atau angka Romawi tertentu) yang menyebabkan mojibake (teks kacau) pada sistem modern. Sebaiknya dinormalisasi.
- Variasi Ortografi
- Ketidakkonsistenan dalam teks, seperti berbagai cara menulis "apel" dalam bahasa Jepang (りんご, リンゴ, 林檎). Menormalisasi membantu mesin pencari mengindeks teks secara akurat.
- Pemangkasan Spasi
- Penghapusan atau standarisasi spasi. Ini mencakup konversi spasi lebar Jepang ke spasi ASCII standar, menghapus spasi di akhir baris, dan meratakan spasi berganda.
- Pemrosesan Regex
- Teknologi yang mendasari (Ekspresi Reguler) yang digunakan alat ini untuk langsung menemukan dan menukar jutaan pola karakter langsung di browser Anda.
FAQ
- Q.Saya ingin mengonversi alfanumerik lebar penuh ke setengah lebar. Preset mana yang harus dipilih?
- Pilih preset 'Alfanumerik → setengah lebar saja'. Hanya alfanumerik dan simbol yang dikonversi ke setengah lebar, katakana dan hiragana dipertahankan.
- Q.Saya ingin mengonversi katakana setengah lebar ke lebar penuh
- Pilih preset 'kana setengah lebar → kana lebar penuh saja'. Kana setengah lebar dengan tanda bersuara dan semi-bersuara juga digabungkan dengan benar menjadi satu karakter lebar penuh.
- Q.Bisakah mengonversi katakana ke hiragana?
- Ya. Anda dapat mengonversi semua sekaligus menggunakan preset 'Semua Hiragana'. Dapat juga diatur secara individual di 'Jenis kana' dalam opsi lanjutan.
- Q.Apakah data teks saya aman?
- Sepenuhnya aman. Semua pemrosesan teks dan operasi regex dieksekusi secara real-time dalam browser web Anda. Tidak ada yang pernah dikirim atau diproses oleh server eksternal.
- Q.Bisakah saya menempel kolom langsung dari Excel/Google Sheets?
- Ya. Anda dapat menyalin seluruh kolom data pelanggan yang berantakan, menempelkannya, menormalisasi alfanumerik, dan langsung menempelkannya kembali ke spreadsheet Anda dengan bersih.
- Q.Bisakah menonaktifkan konversi spasi lebar penuh?
- Ya. Anda memiliki kontrol granular melalui panel pengaturan. Cukup hapus centang kotak terkait jika ingin mempertahankan spasi lebar penuh Jepang.
- Q.Apakah akan memperbaiki tanda dakuten terpisah seperti 'か' + '゙'?
- Ya. Alat ini secara otomatis mendeteksi dakuten (tanda bersuara) yang terpisah dan menggabungkannya kembali dengan cerdas menjadi karakter tunggal yang terstandarisasi (mis., 'が').
- Q.Apa kasus penggunaan umum untuk normalizer ini?
- Sangat berguna untuk membersihkan data kiriman formulir, migrasi database lama, menyeragamkan katalog produk e-commerce, dan standardisasi pemformatan sebelum dikirim ke percetakan.
- Q.Apakah memproses baris baru dengan benar?
- Ya. Ini mempertahankan baris baru yang ada (atau menstandarkannya ke LF/CRLF tergantung pengaturan) sambil memproses teks per baris tanpa menggabungkan paragraf.
- Q.Apakah ada batasan berapa banyak teks yang bisa diproses?
- Karena menggunakan JavaScript lokal yang sangat dioptimalkan, dapat dengan nyaman menangani puluhan ribu karakter dalam milidetik tanpa membekukan browser.
Kasus Penggunaan
Preprocessing input formulir
Ideal untuk langkah validasi sebelum menyimpan ke database.
Pembersihan CSV
Peningkatan akurasi agregasi dengan menghilangkan campuran karakter lebar penuh dan setengah lebar serta spasi yang tidak konsisten.
Proofreading naskah dan artikel
Tampilan perbedaan memungkinkan Anda mengonfirmasi perubahan secara visual, sangat meningkatkan efisiensi proofreading.
Preprocessing program
Seragamkan karakter lebar penuh dan setengah lebar sebelum memproses input pengguna.
Teknis
Mekanisme konversi kode karakter
Konversi lebar penuh ↔ setengah lebar diimplementasikan dengan perhitungan offset titik kode Unicode. Perbedaan antara karakter alfanumerik lebar penuh dan karakter setengah lebar ditetapkan pada 0xFEE0, sehingga dapat dikonversi dengan cepat hanya dengan penambahan dan pengurangan.
Algoritma konversi kana
Normalisasi Unicode (NFKC) digunakan untuk mengonversi dari kana setengah lebar ke kana lebar penuh. Kana setengah lebar dengan tanda suara (mis. ga) adalah dua karakter, tetapi NKFC menggabungkannya menjadi satu karakter lebar penuh.
Tampilan perbedaan (Myers diff)
Menggunakan algoritma Myers diff untuk menghitung penghapusan (merah) dan penyisipan (hijau) untuk setiap karakter dan menyorotnya.
Kirim Umpan Balik
Beri tahu kami pendapat Anda untuk membantu kami menyempurnakan alat ini.
Umpan balik sementara ditangguhkan
Server sedang sibuk atau perlindungan spam aktif. Silakan coba lagi nanti.