하이픈 / 대시 정규화기

하이픈, en 대시, em 대시, 마이너스 기호, 일본어 장음표를 모양이 아니라 역할 기준으로 정리합니다.

URL, 날짜, 버전, CLI 플래그, 코드는 기본적으로 보호되며 모든 처리는 브라우저 안에서 이루어집니다.

텍스트는 이 기기에만 남습니다. 업로드도, 계정도, 서버 측 처리도 없습니다.

구조화된 데이터를 깨뜨리지 않고 대시류 문장부호 정규화

이 도구는 비슷해 보이는 유니코드 문자를 서로 다른 역할로 다룹니다. 기술 토큰은 그대로 유지하면서 편집용 텍스트, 다국어 콘텐츠, 일본어 혼합 문서의 표기를 표준화할 수 있습니다.

사용 방법

  1. 정리하려는 텍스트를 붙여 넣습니다.
  2. 프리셋을 선택하고 텍스트가 애매하면 신뢰도 수준을 조정합니다.
  3. 몇 개가 변경되었는지, 보호되었는지, 수동 검토가 필요한지 확인합니다.
  4. 결과를 복사하거나, 보고서를 저장하거나, 결과를 입력으로 다시 보냅니다.

예시

범위와 삽입구를 서로 다른 기호로 바꾸기

입력
Chapters 10-12 - revised edition
출력
Chapters 10–12 — revised edition

수학에는 유니코드 마이너스 사용

입력
Temperature dropped to -5 and x-1 = 0.
출력
Temperature dropped to −5 and x−1 = 0.

날짜, URL, CLI 플래그 보호

입력
Release 2026-03-12, URL https://example.com/my-tool, flag --dry-run
출력
날짜, URL, CLI 플래그는 그대로 두고 주변 문장만 정규화합니다.

일본어 장음표와 대시를 구분해서 유지

입력
スーパー - A-B - 3-5kg
출력
スーパー ― A‐B ― 3–5kg

핵심 용어

하이픈

단어 내부나 복합어 안의 연결 기호입니다. 유니코드에는 U+2010 같은 전용 하이픈 문자가 있습니다.

En 대시 / Em 대시

문자 체계와 스타일 가이드에 따라 범위, 삽입, 멈춤 표시 등에 쓰이는 대시 문자입니다.

마이너스 기호

음수나 뺄셈을 나타내는 수학 기호입니다. 유니코드에서는 이 역할에 U+2212를 배정합니다.

장음표

가타카나 단어의 모음을 늘이는 일본어 문자입니다. 대시와는 다른 문자입니다.

유니코드 현실 메모

  • ASCII hyphen-minus는 입력은 편하지만 여러 다른 문장부호 역할을 한 문자로 뭉쳐 놓습니다.
  • 일본어 ー와 일본식 ―는 어떤 글꼴에서는 비슷해 보여도 서로 다른 코드 포인트일 수 있습니다.
  • 기술 문서를 과도하게 정규화하면 보기엔 더 깔끔해도 명령어, 버전, 슬러그, URL이 깨질 수 있습니다.

FAQ

텍스트가 어딘가로 업로드되나요?

아니요. 보호, 분류, 정규화는 모두 브라우저에서만 실행됩니다.

자동으로 무엇이 보호되나요?

기본적으로 URL, 이메일, 날짜, 시간, 버전, ID, 파일 경로, CLI 플래그, 코드 블록, 인라인 코드, 기본 마크업을 보호합니다.

ASCII hyphen-minus를 전부 한꺼번에 바꾸면 안 되나요?

ASCII hyphen-minus는 단어 내부 하이픈, 범위 대시, 삽입 대시, 수학적 마이너스를 모두 뜻할 수 있기 때문입니다. 무작정 치환하면 실제 데이터를 망치기 쉽습니다.

일본어 장음표도 바뀌나요?

기본적으로는 아닙니다. 반각 장음표를 전각으로 정규화하도록 선택할 수는 있지만, 장음표를 대시로 바꾸지는 않습니다.

다국어 또는 RTL 텍스트에서도 작동하나요?

예. 입력과 출력은 자동 텍스트 방향을 사용하며, 이 페이지는 영어를 이후 번역의 원문으로 삼을 수 있도록 설계되었습니다.

애매한 경우는 어떻게 처리되나요?

기본 동작은 그대로 유지하고 검토 목록에 올리는 것입니다. 스타일 가이드상 더 공격적인 정규화를 원한다면 강한 모드로 바꿀 수 있습니다.

참고

  • 보호 규칙은 안전 우선 휴리스틱입니다. 보호된 토큰 내부까지 정규화하고 싶다면 먼저 해당 보호를 끄세요.
  • 공격적인 정규화는 내부 스타일, 법률 문서 규칙, 도메인별 표기와 충돌할 수 있습니다.
  • 공유 URL에는 설정만 포함됩니다. 입력 텍스트와 출력 텍스트는 절대 들어가지 않습니다.