digtools
📝
jp text normalizer

Công cụ chuyển đổi toàn/nửa chiều rộng
(Katakana/Chữ và số)

Chuẩn hóa hàng loạt các biến thể ký hiệu như chữ và số toàn chiều rộng, katakana nửa chiều rộng và khoảng trắng toàn chiều rộng.

⚡️
Xử lý trên trình duyệt
Không gửi dữ liệu đến bất kỳ máy chủ nào
✨️
Không cần đăng ký
Không cần tài khoản — sử dụng ngay lập tức
🛡️
Cài đặt sẵn tức thì
Áp dụng ngay các cài đặt phổ biến, có các tùy chọn tinh chỉnh

* Nội dung được xử lý trên trình duyệt của bạn — không bao giờ được gửi đến máy chủ.

⚙️ Tùy chọn nâng cao
about

Giới thiệu

Đây là một công cụ chuẩn hóa các "biến thể" như chữ và số toàn chiều rộng (full-width), katakana nửa chiều rộng (half-width) và khoảng trắng toàn chiều rộng trong văn bản tiếng Nhật cùng một lúc. Nó có thể được sử dụng trong nhiều tình huống, chẳng hạn như tiền xử lý đầu vào biểu mẫu, làm sạch dữ liệu và hiệu đính bản thảo.

Ngoài 5 cài đặt sẵn (cho biểu mẫu, chữ và số nửa chiều rộng, kana toàn chiều rộng, tất cả hiragana và tất cả katakana), công cụ này còn bao gồm các tùy chọn nâng cao như cài đặt riêng biệt cho chữ và số, ký hiệu, khoảng trắng, chiều rộng kana và loại kana, thống nhất ngắt dòng, xóa khoảng trắng ở cuối dòng và chuyển đổi tab. Bạn có thể kiểm tra trực quan các thay đổi với tính năng làm nổi bật sự khác biệt.

Tất cả quá trình xử lý được hoàn tất trong trình duyệt và không có dữ liệu nào được gửi đến máy chủ bên ngoài. Không cần đăng ký thành viên hoặc cài đặt; chỉ cần dán văn bản và bạn có thể bắt đầu chuẩn hóa ngay lập tức.

how to use

Cách sử dụng

BƯỚC 1

Nhập văn bản

Dán văn bản bạn muốn chuẩn hóa vào trường nhập liệu. Hỗ trợ tất cả các loại văn bản, bao gồm đầu vào biểu mẫu, CSV và bản thảo.

BƯỚC 2

Tùy chọn cài đặt sẵn

BẬT "Tự động cập nhật" để điều chỉnh các tùy chọn nâng cao hoặc chọn một cài đặt sẵn.

BƯỚC 3

Sao chép kết quả

Kiểm tra, sao chép và lưu văn bản đã được chuẩn hóa cũng như kết quả làm nổi bật sự khác biệt.

glossary

Thuật ngữ

Kana nửa chiều rộng sang toàn chiều rộng
Chuyển đổi katakana tiếng Nhật nửa chiều rộng (half-width) cũ ("アイウエオ") thành katakana toàn chiều rộng (full-width) tiêu chuẩn ("アイウエオ"). Cần thiết cho khả năng đọc trên web hiện đại.
Chữ và số toàn chiều rộng sang nửa chiều rộng
Chuyển đổi các chữ cái và số tiếng Anh toàn chiều rộng ("123ABC") sang định dạng nửa chiều rộng ASCII tiêu chuẩn ("123ABC"). Quan trọng đối với việc xác thực cơ sở dữ liệu.
Chuẩn hóa Unicode (NFC/NFD)
Quá trình hợp nhất các biểu diễn byte nội bộ khác nhau của cùng một ký tự. Ví dụ: đảm bảo "が" là một ký tự duy nhất thay vì "か" + "゛".
Ký tự phụ thuộc vào máy
Các glyph độc quyền cũ (như số trong vòng tròn hoặc chữ số La Mã cụ thể) gây ra hiện tượng mojibake (văn bản bị cắt xén) trên các hệ thống hiện đại. Tốt nhất là nên chuẩn hóa chúng.
Biến thể chính tả
Sự không nhất quán trong văn bản, chẳng hạn như nhiều cách viết từ "quả táo" trong tiếng Nhật (りんご, リンゴ, 林檎). Việc chuẩn hóa giúp các công cụ tìm kiếm lập chỉ mục văn bản một cách chính xác.
Cắt bỏ khoảng trắng
Việc loại bỏ hoặc chuẩn hóa các khoảng trắng. Nó bao gồm việc chuyển đổi khoảng trắng toàn chiều rộng của Nhật Bản sang khoảng trắng ASCII tiêu chuẩn, loại bỏ khoảng trắng ở cuối dòng và thu gọn nhiều khoảng trắng.
Xử lý Regex
Công nghệ cơ bản (Biểu thức chính quy) được sử dụng bởi công cụ này để định vị và thay thế hàng triệu mẫu ký tự ngay lập tức trực tiếp trong trình duyệt của bạn.
faq

Câu hỏi thường gặp

Q.Tôi muốn chuyển đổi các ký tự chữ và số toàn chiều rộng sang nửa chiều rộng. Tôi nên chọn cài đặt sẵn nào?
Vui lòng chọn cài đặt sẵn 'Chữ và số → chỉ nửa chiều rộng'. Chỉ các chữ và số cùng với ký hiệu được chuyển thành nửa chiều rộng, còn katakana và hiragana được giữ nguyên.
Q.Tôi muốn chuyển đổi katakana nửa chiều rộng sang toàn chiều rộng
Vui lòng chọn cài đặt sẵn 'Kana nửa chiều rộng → chỉ toàn chiều rộng'. Kana nửa chiều rộng có dấu âm đục (dakuten) và bán đục (handakuten) cũng được kết hợp chính xác thành một ký tự toàn chiều rộng.
Q.Bạn có thể chuyển đổi katakana sang hiragana không?
Có. Bạn có thể chuyển đổi tất cả cùng một lúc bằng cách sử dụng cài đặt sẵn 'Chuyển tất cả sang Hiragana'. Bạn cũng có thể cài đặt riêng trong 'Loại Kana' ở các tùy chọn nâng cao.
Q.Dữ liệu văn bản của tôi có an toàn không?
Hoàn toàn an toàn. Tất cả quá trình xử lý văn bản và thao tác regex đều được thực thi theo thời gian thực trong trình duyệt web của bạn. Không có gì được gửi đến hoặc xử lý bởi các máy chủ bên ngoài.
Q.Tôi có thể dán các cột trực tiếp từ Excel/Google Sheets không?
Có. Bạn có thể sao chép toàn bộ cột chứa dữ liệu khách hàng lộn xộn, dán vào, chuẩn hóa các chữ và số, sau đó dán trực tiếp trở lại bảng tính của bạn một cách rõ ràng.
Q.Tôi có thể vô hiệu hóa việc chuyển đổi các khoảng trắng toàn chiều rộng không?
Có. Bạn có quyền kiểm soát chi tiết thông qua bảng cài đặt. Chỉ cần bỏ chọn ô tương ứng nếu bạn muốn giữ lại các khoảng trắng toàn chiều rộng tiếng Nhật.
Q.Công cụ này có sửa các dấu dakuten bị tách rời như 'か' + '゙' không?
Có. Công cụ sẽ tự động phát hiện các dakuten (dấu âm đục) bị tách rời và gộp chúng lại một cách thông minh thành các ký tự đơn, được chuẩn hóa (ví dụ: 'が').
Q.Các trường hợp sử dụng điển hình cho công cụ chuẩn hóa này là gì?
Rất có giá trị để làm sạch dữ liệu đầu vào biểu mẫu, di chuyển các cơ sở dữ liệu cũ, dọn dẹp danh mục sản phẩm thương mại điện tử và chuẩn hóa định dạng trước khi gửi đến máy in.
Q.Nó có xử lý ngắt dòng bình thường không?
Có. Nó bảo toàn các ngắt dòng hiện có của bạn (hoặc chuẩn hóa chúng thành LF/CRLF tùy theo cài đặt) trong khi xử lý văn bản theo từng dòng mà không hợp nhất các đoạn văn.
Q.Có giới hạn về lượng văn bản tôi có thể xử lý không?
Vì công cụ này sử dụng JavaScript cục bộ được tối ưu hóa cao nên nó có thể xử lý thoải mái hàng chục nghìn ký tự tính bằng mili giây mà không làm đơ trình duyệt.
use cases

Các trường hợp sử dụng

Tiền xử lý đầu vào biểu mẫu

Lý tưởng cho các bước xác thực trước khi lưu trữ vào cơ sở dữ liệu.

Làm sạch CSV

Cải thiện độ chính xác tổng hợp bằng cách loại bỏ sự pha trộn giữa các ký tự toàn chiều rộng và nửa chiều rộng cùng với khoảng cách không nhất quán.

Hiệu đính bản thảo và bài viết

Màn hình hiển thị sự khác biệt cho phép bạn xác nhận trực quan các thay đổi, giúp cải thiện đáng kể hiệu quả hiệu đính.

Tiền xử lý chương trình

Đồng nhất các ký tự toàn chiều rộng và nửa chiều rộng trước khi xử lý dữ liệu đầu vào của người dùng.

technology

Kỹ thuật

Cơ chế chuyển đổi mã ký tự

Chuyển đổi toàn chiều rộng ↔ nửa chiều rộng được thực hiện bằng cách tính toán khoảng bù (offset) của các điểm mã Unicode. Sự khác biệt giữa các ký tự chữ và số toàn chiều rộng và ký tự nửa chiều rộng được cố định ở mức 0xFEE0, vì vậy chúng có thể được chuyển đổi nhanh chóng chỉ bằng cách thêm và bớt.

Thuật toán chuyển đổi Kana

Chuẩn hóa Unicode (NFKC) được sử dụng để chuyển đổi từ kana nửa chiều rộng sang kana toàn chiều rộng. Kana nửa chiều rộng với các dấu âm đục (ví dụ: ga) là hai ký tự, nhưng NKFC sẽ kết hợp chúng thành một ký tự toàn chiều rộng (ga).

Hiển thị khác biệt (Myers diff)

Nó sử dụng thuật toán diff Myers để tính toán sự khác biệt trước và sau khi thay đổi, qua đó tính toán các phần bị xóa (màu đỏ) và được chèn (màu xanh lá cây) cho từng ký tự và làm nổi bật chúng.

Tất cả danh mục

Gửi phản hồi

Vui lòng cho chúng tôi biết suy nghĩ của bạn để giúp chúng tôi cải thiện công cụ.

Tuyên bố miễn trách nhiệm

Các công cụ được cung cấp trên trang web này hoàn toàn miễn phí, nhưng vui lòng sử dụng theo rủi ro của riêng bạn. Chúng tôi không đảm bảo về độ chính xác, đầy đủ hoặc an toàn của bất kỳ kết quả tính toán, kết quả chuyển đổi hoặc dữ liệu được tạo ra nào. Xin lưu ý rằng người vận hành không chịu trách nhiệm về bất kỳ thiệt hại hoặc sự cố nào gây ra bởi việc sử dụng các công cụ này. Hầu hết các công cụ xử lý tệp và tính toán ngay trong trình duyệt của bạn, nghĩa là dữ liệu bạn nhập không được gửi hoặc lưu trữ trên máy chủ của chúng tôi.