Нармалізатар дэфісаў і працяжнікаў

Разбірайцеся з дэфісамі, en dash, em dash, знакамі мінус і японскімі доўгімі знакамі працягнення па іх ролі, а не толькі па форме.

URL, даты, версіі, CLI-пераключальнікі і код абаронены па змаўчанні, і ўсё працуе ў вашым браўзеры.

Ваш тэкст застаецца на гэтай прыладзе. Без загрузкі, без уліковага запісу, без сервернай апрацоўкі.

Нармалізуйце знакі, падобныя да працяжнікаў, не ламаючы структураваныя даныя

Гэты інструмент разглядае падобныя сімвалы Unicode як знакі з рознымі ролямі. Ён захоўвае тэхнічныя токены, дапамагаючы стандартызаваць рэдактарскі тэкст, шматмоўны кантэнт і змешанае японскае пісьмо.

Як карыстацца

  1. Устаўце тэкст, які хочаце ачысціць.
  2. Выберыце прэсэт і пры патрэбе адрэгулюйце ўзровень упэўненасці, калі тэкст неадназначны.
  3. Праверце, колькі элементаў было зменена, абаронена або пакінута для ручной праверкі.
  4. Скапіруйце вынік, захавайце справаздачу або верніце вынік назад у ўвод для наступнага праходу.

Прыклады

Зрабіць дыяпазоны і дужкавыя разрывы рознымі знакамі

Увод
Раздзелы 10-12 - перагледжанае выданне
Вынік
Раздзелы 10–12 — перагледжанае выданне

Выкарыстоўваць Unicode-мінус для матэматыкі

Увод
Тэмпература апусцілася да -5 і x-1 = 0.
Вынік
Тэмпература апусцілася да −5 і x−1 = 0.

Абарона дат, URL і CLI-пераключальнікаў

Увод
Выпуск 2026-03-12, URL https://example.com/my-tool, CLI-пераключальнік --dry-run
Вынік
Дата, URL і CLI-пераключальнік застаюцца без змянення, а навакольны тэкст нармалізуецца.

Трымаць японскія доўгія знакі працягнення асобна ад дэфісаў

Увод
スーパー - A-B - 3-5kg
Вынік
スーパー ― A‐B ― 3–5kg

Асноўныя тэрміны

Дэфіс

Злучальны знак унутры слова або складанага тэрміна. Unicode дае асобныя сімвалы дэфіса, такія як U+2010.

en-рыса / em-рыса

Сімвалы працяжніка, якія звычайна выкарыстоўваюцца для дыяпазонаў, паўз або дужкавых уставак у залежнасці ад сістэмы пісьма і стылю.

Знак мінус

Матэматычны сімвал адмовы або вылічэння. Unicode прызначае для гэтай ролі U+2212.

Доўгі знак працягнення

Японскі сімвал для падаўжэння галосных у катаканавых словах. Гэта не тое ж самае, што працяжнік.

Заўвагі з рэчаіснасці Unicode

  • ASCII-дэфіс зручны для ўводу, але ён зводзіць некалькі розных роляў знакаў прыпынку да аднаго сімвала.
  • Японскія ー і японска-падобны ― у некаторых шрыфтах могуць выглядаць падобна, але заставацца рознымі кодавымі кропкамі.
  • Занадта агрэсіўная нармалізацыя тэхнічнага тэксту можа сапсаваць каманды, версіі, slug-і і URL, нават калі вынік выглядае прыгажэй.

Частыя пытанні

Ці загружаецца мой тэкст куды-небудзь?

Не. Абарона, класіфікацыя і нармалізацыя ўсе працуюць толькі ў вашым браўзеры.

Што абаронена аўтаматычна?

Па змаўчанні інструмент абараняе URL, адрасы электроннай пошты, даты, час, версіі, ідэнтыфікатары, шляхі да файлаў, CLI-пераключальнікі, кодавыя блокі, унутраны код і базавую разметку.

Чаму б проста не замяніць кожны ASCII-дэфіс?

Бо ASCII-дэфіс можа азначаць дэфіс у слове, знак дыяпазону, дужкавы працяжнік або матэматычны мінус. Бяздумная замена часта ламае рэальныя даныя.

Ці зменіць ён японскія доўгія знакі працягнення?

Не па змаўчанні. Вы можаце дадаткова нармалізаваць палавіннашырокі доўгі знак да поўнашырокага, але інструмент не ператварае доўгія знакі працягнення ў працяжнікі.

Ці працуе гэта з шматмоўным або RTL-тэкстам?

Так. Увод і вывад выкарыстоўваюць аўтаматычны кірунак тэксту, а старонка пабудавана так, каб англійская магла быць зыходнай мовай для будучых перакладаў.

Што адбываецца з неадназначнымі выпадкамі?

Па змаўчанні яны захоўваюцца і пазначаюцца для праверкі. Вы можаце пераключыцца на больш моцны рэжым, калі ваш стыль патрабуе больш агрэсіўнай нармалізацыі.

Заўвагі

  • Правілы абароны - гэта бяспечныя эврыстыкі. Калі вам сапраўды трэба нармалізаваць унутры абароненага токена, спачатку адключыце гэту абарону.
  • Агрэсіўная нармалізацыя можа канфліктаваць з унутраным стылем, юрыдычнымі правіламі падрыхтоўкі або спецыялізаванымі абазначэннямі.
  • Агульная спасылка змяшчае толькі налады. Яна ніколі не ўключае ні ўваходны тэкст, ні выніковы тэкст.