Bộ chuẩn hóa dấu gạch nối / gạch ngang

Phân loại dấu gạch nối, dấu gạch ngang ngắn, dấu gạch ngang dài, dấu trừ và dấu kéo dài âm tiếng Nhật theo vai trò thay vì chỉ theo hình dạng.

URL, ngày tháng, phiên bản, cờ CLI và mã được bảo vệ theo mặc định, và mọi thứ chạy trong trình duyệt của bạn.

Văn bản của bạn vẫn ở trên thiết bị này. Không tải lên, không cần tài khoản, không có xử lý phía máy chủ.

Chuẩn hóa các dấu gạch ngang giống dấu câu mà không làm hỏng dữ liệu có cấu trúc

Công cụ này coi các ký tự Unicode trông giống nhau như các vai trò khác nhau. Nó giữ nguyên các token kỹ thuật trong khi giúp bạn chuẩn hóa văn bản biên tập, nội dung đa ngôn ngữ và kiểu viết tiếng Nhật pha trộn.

Cách sử dụng

  1. Dán văn bản bạn muốn làm sạch.
  2. Chọn một mẫu sẵn và điều chỉnh mức tin cậy nếu văn bản còn mơ hồ.
  3. Xem lại có bao nhiêu mục được thay đổi, được bảo vệ hoặc còn để kiểm tra thủ công.
  4. Sao chép kết quả, lưu báo cáo hoặc đưa kết quả quay lại để xử lý thêm một lượt.

Ví dụ

Chuyển các phạm vi và dấu ngắt trong ngoặc thành ký hiệu riêng

Đầu vào
Chapters 10-12 - revised edition
Đầu ra
Chapters 10–12 — revised edition

Dùng dấu trừ Unicode cho toán học

Đầu vào
Temperature dropped to -5 and x-1 = 0.
Đầu ra
Temperature dropped to −5 and x−1 = 0.

Bảo vệ ngày tháng, URL và cờ CLI

Đầu vào
Release 2026-03-12, URL https://example.com/my-tool, flag --dry-run
Đầu ra
Ngày tháng, URL và cờ CLI được giữ nguyên, còn phần văn xuôi xung quanh được chuẩn hóa.

Giữ dấu kéo dài âm tiếng Nhật tách biệt khỏi dấu gạch ngang

Đầu vào
スーパー - A-B - 3-5kg
Đầu ra
スーパー ― A‐B ― 3–5kg

Thuật ngữ chính

Dấu gạch nối

Một ký tự nối trong một từ hoặc thuật ngữ ghép. Unicode cung cấp các ký tự dấu gạch nối riêng như U+2010.

Dấu gạch ngang ngắn / dài

Các ký tự dấu gạch ngang thường được dùng cho phạm vi, ngắt câu hoặc tạm dừng trong ngoặc, tùy theo hệ chữ và hướng dẫn phong cách.

Dấu trừ

Ký hiệu số âm hoặc phép trừ trong toán học. Unicode gán U+2212 cho vai trò này.

Dấu kéo dài âm

Một ký tự tiếng Nhật dùng để kéo dài âm nguyên âm trong từ katakana. Nó không giống dấu gạch ngang.

Ghi chú từ thực tế của Unicode

  • Dấu gạch nối ASCII dễ gõ, nhưng nó gộp nhiều vai trò dấu câu khác nhau vào một ký tự.
  • Ký tự ー kiểu Nhật và ― kiểu Nhật có thể trông giống nhau trong một số phông chữ dù vẫn là các mã ký tự khác nhau.
  • Chuẩn hóa quá tay văn bản kỹ thuật có thể làm hỏng lệnh, phiên bản, slug và URL ngay cả khi đầu ra trông đẹp hơn.

Câu hỏi thường gặp

Văn bản của tôi có được tải lên đâu không?

Không. Việc bảo vệ, phân loại và chuẩn hóa đều chỉ chạy trong trình duyệt của bạn.

Những gì được bảo vệ tự động?

Theo mặc định, công cụ bảo vệ URL, email, ngày tháng, thời gian, phiên bản, ID, đường dẫn tệp, cờ CLI, khối mã, mã nội dòng và đánh dấu cơ bản.

Tại sao không thay mọi dấu gạch nối ASCII một cách mù quáng?

Vì dấu gạch nối ASCII có thể là dấu nối trong từ, dấu gạch ngang phạm vi, dấu gạch ngang trong ngoặc hoặc dấu trừ toán học. Việc thay thế mù quáng thường làm hỏng dữ liệu thật.

Nó có thay đổi dấu kéo dài âm tiếng Nhật không?

Không theo mặc định. Bạn có thể tùy chọn chuẩn hóa dấu kéo dài âm nửa chiều rộng sang dạng toàn chiều rộng, nhưng công cụ sẽ không biến dấu kéo dài âm thành dấu gạch ngang.

Nó có hoạt động với văn bản đa ngôn ngữ hoặc RTL không?

Có. Đầu vào và đầu ra dùng hướng văn bản tự động, và trang được thiết kế để tiếng Anh có thể làm nguồn cho các bản dịch sau này.

Điều gì xảy ra với các trường hợp mơ hồ?

Hành vi mặc định là giữ nguyên chúng và liệt kê để xem xét. Bạn có thể chuyển sang chế độ mạnh hơn nếu hướng dẫn phong cách của bạn thích chuẩn hóa mạnh tay.

Lưu ý

  • Các quy tắc bảo vệ là các kinh nghiệm ưu tiên an toàn. Nếu bạn thực sự muốn chuẩn hóa bên trong một token được bảo vệ, hãy tắt bảo vệ đó trước.
  • Chuẩn hóa quá mạnh có thể xung đột với phong cách nội bộ, quy tắc soạn thảo pháp lý hoặc ký hiệu chuyên ngành.
  • URL chia sẻ chỉ chứa cài đặt. Nó không bao giờ bao gồm văn bản đầu vào hoặc đầu ra.