Hyphen / Dash-normalisator

Sorteer koppeltekens, en-dashes, em-dashes, mintekens en Japanse lange-klanktekens op rol in plaats van alleen op vorm.

URL's, datums, versies, CLI-argumenten en code worden standaard beschermd, en alles draait in je browser.

Je tekst blijft op dit apparaat. Geen upload, geen account, geen verwerking aan serverzijde.

Normaliseer interpunctie-achtige strepen zonder gestructureerde gegevens te breken

Deze tool behandelt Unicode-gelijkende tekens als verschillende rollen. Hij houdt technische tokens intact terwijl hij helpt redactionele tekst, meertalige inhoud en Japans gemengde tekst te standaardiseren.

Hoe te gebruiken

  1. Plak de tekst die je wilt opschonen.
  2. Kies een preset en pas de zekerheidsniveaus aan als de tekst dubbelzinnig is.
  3. Controleer hoeveel items zijn gewijzigd, beschermd of voor handmatige controle zijn overgebleven.
  4. Kopieer het resultaat, sla het rapport op of stuur het resultaat terug voor nog een ronde.

Voorbeelden

Bereiken en pauzes tussen haakjes omzetten naar afzonderlijke tekens

Invoer
Chapters 10-12 - revised edition
Uitvoer
Chapters 10–12 — revised edition

Gebruik het Unicode-minteken voor wiskunde

Invoer
Temperature dropped to -5 and x-1 = 0.
Uitvoer
Temperature dropped to −5 and x−1 = 0.

Bescherm datums, URL's en CLI-argumenten

Invoer
Release 2026-03-12, URL https://example.com/my-tool, flag --dry-run
Uitvoer
De datum, URL en CLI-argument blijven ongemoeid terwijl de omliggende tekst wordt genormaliseerd.

Japanse lange-klanktekens gescheiden houden van strepen

Invoer
スーパー - A-B - 3-5kg
Uitvoer
スーパー ― A‐B ― 3–5kg

Kernbegrippen

Koppelteken

Een verbindingsteken binnen een woord of samenstelling. Unicode biedt speciale koppeltekenkarakters zoals U+2010.

En-dash / em-dash

Streeptekens die vaak worden gebruikt voor bereiken, pauzes of parenthetische onderbrekingen, afhankelijk van het schriftsysteem en de stijlgids.

Minteken

Het wiskundige teken voor negatie of aftrekken. Unicode kent hiervoor U+2212 toe.

Lange-klankteken

Een Japans teken dat de klinkerklank in katakanawoorden verlengt. Het is niet hetzelfde als een streepje.

Opmerkingen uit de Unicode-praktijk

  • Het ASCII-koppelteken-minteken is handig om te typen, maar het bundelt meerdere verschillende interpunctierollen in één teken.
  • Japans ー en Japans-achtig ― kunnen er in sommige lettertypen bijna hetzelfde uitzien terwijl het nog steeds verschillende codepunten zijn.
  • Te agressieve normalisatie van technische tekst kan opdrachten, versies, slugs en URL's breken, zelfs als de uitvoer netter oogt.

FAQ

Wordt mijn tekst ergens geüpload?

Nee. Bescherming, classificatie en normalisatie draaien alleen in je browser.

Wat wordt automatisch beschermd?

Standaard beschermt de tool URL's, e-mails, datums, tijden, versies, ID's, bestandspaden, CLI-argumenten, codeblokken, inline code en eenvoudige markup.

Waarom niet elk minteken blind vervangen?

Omdat het ASCII-minteken verschillende dingen kan betekenen: een woordkoppelteken, een bereiksstreep, een parenthetisch streepje of een wiskundig minteken. Blind vervangen breekt vaak echte gegevens.

Verandert het Japanse lange-klanktekens?

Niet standaard. Je kunt optioneel het halve-breedte lange-klankteken naar de volledige-breedte vorm normaliseren, maar de tool verandert lange-klanktekens niet in strepen.

Werkt dit met meertalige tekst of RTL-tekst?

Ja. Invoer en uitvoer gebruiken automatische tekstrichting, en de pagina is zo ontworpen dat Engels als bron voor toekomstige vertalingen kan dienen.

Wat gebeurt er met dubbelzinnige gevallen?

Standaard blijven die behouden en worden ze voor controle gemarkeerd. Je kunt overschakelen naar een strengere modus als je stijlgids agressieve normalisatie verkiest.

Opmerkingen

  • Beschermingsregels zijn heuristieken die veiligheid vooropstellen. Als je echt binnen een beschermd token wilt normaliseren, zet die bescherming dan eerst uit.
  • Agressieve normalisatie kan botsen met huisstijl, juridische opmaakregels of domeinspecifieke notatie.
  • De gedeelde URL bevat alleen instellingen. De invoertekst of uitvoertekst wordt nooit opgenomen.