Bindestrek- og tankestrek-normalisering

Skille mellom bindestreker, tankestreker, minustegn og japanske lang vokalstreker etter rolle, ikke bare etter form.

URL-er, datoer, versjoner, CLI-flagg og kode er beskyttet som standard, og alt kjører i nettleseren din.

Teksten din blir værende på denne enheten. Ingen opplasting, ingen konto, ingen behandling på server.

Normaliser streklignende tegn uten å ødelegge strukturert data

Verktøyet behandler Unicode-liknende tegn som ulike roller. Det bevarer tekniske tokens intakte mens du standardiserer redaksjonstekst, flerspråklig innhold og japansk blandet skriving.

Slik bruker du det

  1. Lim inn teksten du vil rydde opp i.
  2. Velg en forhåndsinnstilling og juster styrken hvis teksten er tvetydig.
  3. Se hvor mange elementer som ble endret, beskyttet eller satt til manuell gjennomgang.
  4. Kopier resultatet, lagre rapporten eller send resultatet tilbake for en ny runde.

Eksempler

Gjør intervaller og parentesavbrudd til egne tegn

Inndata
Kapittel 10-12 - revidert utgave
Utdata
Kapittel 10–12 — revidert utgave

Bruk Unicode-minustegnet i matematikk

Inndata
Temperaturen falt til -5 og x-1 = 0.
Utdata
Temperaturen falt til −5 og x−1 = 0.

Beskytt datoer, URL-er og CLI-flagg

Inndata
Utgivelse 2026-03-12, URL https://example.com/my-tool, flagg --dry-run
Utdata
Datoen, URL-en og CLI-flagget forblir urørt mens teksten rundt normaliseres.

Hold japanske lang vokalstrek-tegn adskilt fra bindestreker

Inndata
スーパー - A-B - 3-5kg
Utdata
スーパー ― A‐B ― 3–5kg

Viktige begreper

Bindestrek

En forbindelsesstrek inne i et ord eller et sammensatt uttrykk. Unicode har egne bindestrektegn, som U+2010.

Tankestrek / lang tankestrek

Strektegn som ofte brukes for intervaller, avbrudd eller parentesiske pauser, avhengig av skriftsystem og stilguide.

Minustegn

Det matematiske tegnet for negativ verdi eller subtraksjon. Unicode bruker U+2212 for denne rollen.

Lang vokalstrek

Et japansk tegn som brukes til å forlenge vokallyder i katakana-ord. Det er ikke det samme som en bindestrek.

Notater om Unicode i praksis

  • ASCII-hyphen-minus er praktisk å skrive, men den samler flere ulike skilletegnroller i ett tegn.
  • Japanske ー og japansk stil ― kan se like ut i noen skrifter, men er fortsatt ulike kodepunkter.
  • Overnormalisering av teknisk tekst kan ødelegge kommandoer, versjoner, slugs og URL-er, selv når resultatet ser penere ut.

Ofte stilte spørsmål

Sendes teksten min noe sted?

Nei. Beskyttelse, klassifisering og normalisering kjører bare i nettleseren din.

Hva blir beskyttet automatisk?

Som standard beskytter verktøyet URL-er, e-postadresser, datoer, klokkeslett, versjoner, ID-er, filstier, CLI-flagg, kodeblokker, inline-kode og enkel markup.

Hvorfor ikke erstatte hver eneste hyfen-minus blindt?

Fordi ASCII-hyphen-minus kan bety en bindestrek i et ord, en intervallstrek, en parentesstrek eller et matematisk minustegn. En blind erstatning ødelegger ofte ekte data.

Vil det endre japanske lang vokalstreker?

Ikke som standard. Du kan valgfritt normalisere halvbreddetegnet til fullbreddetegnet, men verktøyet gjør ikke lang vokalstrek om til tankestreker.

Fungerer det med flerspråklig tekst eller RTL-tekst?

Ja. Inndata og utdata bruker automatisk tekstretning, og siden er laget slik at engelsk kan være kilde for fremtidige oversettelser.

Hva skjer med tvetydige tilfeller?

Standardatferden er å bevare dem og liste dem opp for gjennomgang. Du kan bytte til en strengere modus hvis stilguiden din foretrekker mer aggressiv normalisering.

Merknader

  • Beskyttelsesreglene er heuristikk som prioriterer sikkerhet. Hvis du virkelig vil normalisere inne i en beskyttet token, må du slå av beskyttelsen først.
  • Aggressiv normalisering kan komme i konflikt med interne stilregler, juridisk språkføring eller domenespesifikk notasjon.
  • Delingslenker med bare innstillinger inkluderer aldri input- eller output-tekst, men de valgte reglene er synlige for mottakeren.