Perbaiki pemisahan dakuten di Mac
(Normalisasi Unicode)
Perbaiki pemisahan nama file khusus Mac secara instan di browser.
🔍 Analisis Detail (Code Point)
Tentang
Alat online yang melakukan normalisasi teks Unicode (NFC/NFD/NFKC/NFKD) secara real time. Anda dapat dengan mudah melakukan pemrosesan normalisasi yang diperlukan untuk menyatukan kode karakter dan membandingkannya.
Mendukung pola normalisasi yang sering terjadi dalam pemrosesan teks, seperti penyatuan karakter lebar penuh dan setengah, penggabungan/pemisahan tanda suara, dan normalisasi karakter kompatibel.
Semua pemrosesan selesai di dalam browser dan tidak ada data yang dikirim ke server.
Cara Pakai
Masukkan Teks
Masukkan atau tempel teks yang ingin dinormalisasi ke dalam bidang input.
Pilih Format
Pilih format normalisasi: NFC, NFD, NFKC, atau NFKD.
Konfirmasi/Salin Hasil
Periksa perubahan teks dan code point setelah normalisasi dan salin.
Glosarium
- Normalisasi Unicode
- Proses mengonversi teks ke bentuk Unicode kanonik sehingga urutan code point yang berbeda yang mewakili karakter yang sama diperlakukan secara identik.
- NFC (Komposisi Kanonik)
- Mengurai karakter dan kemudian menyusunnya kembali ke dalam bentuk terkomposisi. Bentuk normalisasi yang paling banyak digunakan untuk konten web dan pemrosesan teks umum.
- NFD (Penguraian Kanonik)
- Mengurai karakter menjadi karakter dasar ditambah karakter kombinasi. Digunakan oleh sistem file macOS dan beberapa lingkungan Unix.
- NFKC (Komposisi Kompatibilitas)
- Mengonversi karakter kompatibilitas (mis., alfanumerik lebar penuh, katakana setengah lebar) ke bentuk standarnya dan kemudian menyusunnya. Umum digunakan untuk pencarian dan normalisasi data.
- Karakter Kombinasi
- Code point Unicode yang melekat pada karakter dasar sebelumnya daripada berdiri sendiri, seperti tanda aksen dan diakritik.
- Code Point
- Pengidentifikasi numerik unik yang ditetapkan untuk setiap karakter dalam Unicode, ditulis sebagai U+XXXX (mis., U+3042 untuk karakter hiragana あ).
FAQ
- Q.Apa perbedaan antara NFC dan NFKC?
- NFC menyatukan pengkodean internal tanpa mengubah teks yang terlihat. NFKC juga mengonversi karakter kompatibel — misalnya, digit lebar penuh menjadi setengah lebar.
- Q.Bentuk mana yang harus digunakan?
- Gunakan NFC untuk teks umum. Gunakan NFKC sebelum penyimpanan database atau pengindeksan pencarian. Pertimbangkan NFD saat menargetkan kompatibilitas macOS.
- Q.Apakah teks saya dikirim ke server?
- Tidak. Semua normalisasi berjalan secara lokal di browser Anda. Teks Anda tidak pernah dikirim ke server eksternal mana pun.
- Q.Bisakah normalisasi menghapus karakter?
- Biasanya tidak. Namun, NFKC dapat mengubah karakter secara visual — misalnya, mengonversi huruf lebar penuh ke setengah lebar.
- Q.Mengapa perbandingan string memerlukan normalisasi?
- Karakter yang terlihat sama dapat memiliki pengkodean internal yang berbeda. Normalisasi ke bentuk umum memastikan perbandingan dan pencarian bekerja dengan andal.
- Q.Apakah ini berguna untuk teks Jepang?
- Ya. Dokumen Jepang sering mencampur karakter lebar penuh dan setengah. Normalisasi menyelesaikan inkonsistensi ini dan meningkatkan kualitas data.
Kasus Penggunaan
Penyatuan Database
Pastikan keseragaman data dengan menormalisasi input pengguna.
Perbandingan String
Capai perbandingan dan pencarian yang akurat menggunakan string yang dinormalisasi.
Pra-pemrosesan Teks
Terapkan normalisasi sebagai pra-pemrosesan untuk NLP dan analisis data.
Investigasi Kode Karakter
Periksa code point karakter untuk menyelidiki masalah pengkodean.
Teknis
API String.prototype.normalize()
Karena hanya fungsi native khusus browser yang digunakan, bahkan data string yang besar dapat dinormalisasi secara instan dalam beberapa milidetik.
Kirim Umpan Balik
Beri tahu kami pendapat Anda untuk membantu kami menyempurnakan alat ini.
Umpan balik sementara ditangguhkan
Server sedang sibuk atau perlindungan spam aktif. Silakan coba lagi nanti.