Normalizator de cratimă / liniuță

Separă cratimele, liniile en, liniile em, semnele minus și marcajele japoneze de prelungire după rol, nu doar după formă.

URL-urile, datele, versiunile, marcajele CLI și codul sunt protejate implicit, iar totul rulează în browserul tău.

Textul tău rămâne pe acest dispozitiv. Fără încărcare, fără cont, fără procesare pe server.

Normalizează semnele de tip cratimă fără să strici datele structurate

Acest instrument tratează caracterele Unicode asemănătoare ca roluri diferite. Păstrează intacte tokenurile tehnice, ajutându-te în același timp să standardizezi textul editorial, conținutul multilingv și scrierea mixtă japoneză.

Cum se folosește

  1. Lipește textul pe care vrei să-l cureți.
  2. Alege o presetare și ajustează nivelul de încredere dacă textul este ambiguu.
  3. Verifică câte elemente au fost modificate, protejate sau lăsate pentru revizuire manuală.
  4. Copiază rezultatul, salvează raportul sau trimite rezultatul înapoi pentru încă o trecere.

Exemple

Transformă intervalele și pauzele parentetice în semne distincte

Intrare
Capitolele 10-12 - ediția revizuită
Ieșire
Capitolele 10–12 — ediția revizuită

Folosește semnul minus Unicode pentru matematică

Intrare
Temperatura a scăzut la -5 și x-1 = 0.
Ieșire
Temperatura a scăzut la −5 și x−1 = 0.

Protejează datele, URL-urile și marcajele CLI

Intrare
Lansare 2026-03-12, URL https://example.com/my-tool, marcaj --dry-run
Ieșire
Data, URL-ul și marcajul CLI rămân neschimbate, în timp ce textul din jur este normalizat.

Păstrează separat marcajele japoneze de prelungire de cratime

Intrare
スーパー - A-B - 3-5kg
Ieșire
スーパー ― A‐B ― 3–5kg

Termeni cheie

Cratimă

Un element de legătură în interiorul unui cuvânt sau al unui termen compus. Unicode oferă caractere dedicate, cum ar fi U+2010.

Liniuță en / liniuță em

Caractere de liniuță folosite frecvent pentru intervale, pauze sau întreruperi parentetice, în funcție de sistemul de scriere și de ghidul de stil.

Semn minus

Simbolul matematic pentru negativ sau scădere. Unicode atribuie U+2212 acestui rol.

Semn de prelungire

Un caracter japonez folosit pentru a prelungi sunetele vocalice în cuvintele katakana. Nu este același lucru cu o cratimă.

Note din realitatea Unicode

  • Hyphen-minus ASCII este comod de tastat, dar comprimă mai multe roluri de punctuație diferite într-un singur caracter.
  • Japonezul ー și bara japoneză ― pot arăta asemănător în unele fonturi, deși sunt code point-uri diferite.
  • Normalizarea excesivă a textului tehnic poate strica comenzi, versiuni, slug-uri și URL-uri chiar și atunci când rezultatul arată mai bine.

Întrebări frecvente

Textul meu este încărcat undeva?

Nu. Protecția, clasificarea și normalizarea rulează doar în browserul tău.

Ce este protejat automat?

Implicit, instrumentul protejează URL-urile, e-mailurile, datele, orele, versiunile, ID-urile, căile de fișiere, marcajele CLI, blocurile de cod, codul inline și marcajele de bază.

De ce să nu înlocuiesc orbște fiecare hyphen-minus?

Pentru că hyphen-minus ASCII poate însemna o cratimă de cuvânt, o liniuță de interval, o pauză parentetică sau un semn minus matematic. O înlocuire oarbă strică adesea date reale.

Va schimba marcajele japoneze de prelungire?

Nu implicit. Poți normaliza opțional semnul de prelungire half-width în forma full-width, dar instrumentul nu va transforma marcajele de prelungire în cratime.

Funcționează cu text multilingv sau RTL?

Da. Intrările și ieșirile folosesc direcția automată a textului, iar pagina este concepută astfel încât engleza să poată fi sursa pentru traduceri viitoare.

Ce se întâmplă cu cazurile ambigue?

Comportamentul implicit este să le păstreze și să le listeze pentru revizuire. Poți comuta la un mod mai strict dacă ghidul tău de stil preferă normalizarea agresivă.

Note

  • Regulile de protecție sunt euristici orientate spre siguranță. Dacă vrei cu adevărat să normalizezi în interiorul unui token protejat, dezactivează mai întâi acea protecție.
  • Normalizarea agresivă poate intra în conflict cu stilul casei, regulile de redactare juridică sau notația specifică unui domeniu.
  • URL-ul partajat conține doar setările. Nu include niciodată textul de intrare sau textul de ieșire.