Normalizador de hífen / travessão

Distingua hífens, travessões curtos, travessões longos, sinais de menos e marcas longas japonesas pelo papel, e não apenas pela forma.

URLs, datas, versões, flags de CLI e código são protegidos por padrão, e tudo é executado no seu navegador.

Seu texto permanece neste dispositivo. Sem upload, sem conta, sem processamento no servidor.

Normalize travessões semelhantes à pontuação sem quebrar dados estruturados

Esta ferramenta trata semelhantes do Unicode como papéis diferentes. Ela mantém os tokens técnicos intactos enquanto ajuda a padronizar texto editorial, conteúdo multilíngue e escrita mista em japonês.

Como usar

  1. Cole o texto que deseja limpar.
  2. Escolha uma predefinição e ajuste o nível de confiança se o texto for ambíguo.
  3. Revise quantos itens foram alterados, protegidos ou deixados para revisão manual.
  4. Copie o resultado, salve o relatório ou envie o resultado de volta para outra passagem.

Exemplos

Transformar intervalos e pausas parentéticas em marcas distintas

Entrada
Capítulos 10-12 - edição revisada
Saída
Capítulos 10–12 — edição revisada

Usar o sinal de menos Unicode para matemática

Entrada
A temperatura caiu para -5 e x-1 = 0.
Saída
A temperatura caiu para −5 e x−1 = 0.

Proteger datas, URLs e flags de CLI

Entrada
Lançamento 2026-03-12, URL https://example.com/my-tool, flag --dry-run
Saída
A data, a URL e a flag de CLI permanecem intactas enquanto o texto ao redor é normalizado.

Manter marcas longas japonesas separadas de travessões

Entrada
スーパー - A-B - 3-5kg
Saída
スーパー ― A‐B ― 3–5kg

Termos principais

Hífen

Um conector dentro de uma palavra ou termo composto. O Unicode fornece caracteres de hífen dedicados, como U+2010.

Travessão curto / travessão longo

Caracteres de travessão comumente usados para intervalos, pausas ou parênteses, dependendo do sistema de escrita e do guia de estilo.

Sinal de menos

O símbolo matemático de negativo ou subtração. O Unicode atribui U+2212 a esse papel.

Marca longa

Um caractere japonês usado para alongar sons de vogais em palavras katakana. Não é a mesma coisa que um travessão.

Observações da realidade Unicode

  • O hífen-menor ASCII é conveniente para digitar, mas mistura vários papéis de pontuação diferentes em um único caractere.
  • O japonês ー e o estilo japonês ― podem parecer semelhantes em algumas fontes, embora sejam pontos de código diferentes.
  • Normalizar demais texto técnico pode quebrar comandos, versões, slugs e URLs, mesmo quando a saída parece melhor.

Perguntas frequentes

Meu texto é enviado para algum lugar?

Não. A proteção, classificação e normalização são executadas apenas no seu navegador.

O que é protegido automaticamente?

Por padrão, a ferramenta protege URLs, e-mails, blocos de código cercados, código embutido, datas, horários, versões, IDs, caminhos de arquivo, flags de CLI e marcação básica.

Por que não substituir cegamente todos os hífens-menores?

Porque o hífen-menor ASCII pode significar um hífen de palavra, um travessão de intervalo, um travessão parentético ou um sinal de menos matemático. A substituição cega costuma quebrar dados reais.

Ela altera marcas longas japonesas?

Não por padrão. Você pode opcionalmente normalizar a marca longa de meia largura para a forma de largura total, mas a ferramenta não transforma marcas longas em travessões.

Ela funciona com texto multilíngue ou RTL?

Sim. As entradas e saídas usam direção automática de texto, e a página foi projetada para que o inglês possa ser a fonte para futuras traduções.

O que acontece com casos ambíguos?

O comportamento padrão é preservá-los e listá-los para revisão. Você pode mudar para um modo mais forte se o seu guia de estilo preferir normalização agressiva.

Notas

  • As regras de proteção são heurísticas de segurança em primeiro lugar. Se você realmente quiser normalizar dentro de um token protegido, desative essa proteção primeiro.
  • A normalização agressiva pode conflitar com o estilo da casa, regras de redação jurídica ou notação específica do domínio.
  • O link compartilhado contém apenas configurações. Ele nunca inclui o texto de entrada ou de saída.