连字符 / 破折号规范化器

按字符角色而不是外观来区分连字符、en dash、em dash、减号和日文长音符。

URL、日期、版本、CLI 参数和代码默认受保护,所有处理都在你的浏览器中完成。

你的文本只保留在这个设备上。没有上传、没有账户、也没有服务器端处理。

在不破坏结构化数据的前提下规范化类似标点的短横线

这个工具把 Unicode 中外观相似的字符视为不同角色。它会保留技术标记的原样,同时帮助你统一编辑文本、多语言内容和日文混排文本。

使用方法

  1. 将需要整理的文本粘贴进来。
  2. 选择一个预设,如文本含义不明确,再调整置信度。
  3. 查看改动、已保护项和待人工检查项的数量。
  4. 复制结果、保存报告,或把结果再送进下一轮处理。

示例

把范围和括号中的断开标记分开

输入
第 10-12 章 - 修订版
输出
第 10–12 章 — 修订版

数学中使用 Unicode 减号

输入
温度降到 -5,x-1 = 0。
输出
温度降到 −5,x−1 = 0。

保护日期、URL 和 CLI 参数

输入
发布 2026-03-12,URL https://example.com/my-tool,参数 --dry-run
输出
日期、URL 和 CLI 参数保持不变,周围的正文会被规范化。

让日文长音符与破折号分开

输入
- A - B - 3 - 5公斤
输出
=================================================================================================== ==========================================================================

关键词

连字符

单词或复合词内部的连接符。Unicode 提供了专门的连字符字符,如 U+2010。

en dash / em dash

常用于范围、断开或括号内停顿的短横线,具体使用取决于书写系统和风格指南。

减号

数学中的负号或减号。Unicode 为这个角色分配了 U+2212。

长音符

日文片假名中用于延长元音的字符。它并不等同于破折号。

Unicode 现实小知识

  • ASCII 连字符减号虽然好打,但会把多种不同的标点角色压成同一个字符。
  • 日文 ー 和日式 ― 在某些字体里看起来很像,但它们仍然是不同的码点。
  • 过度规范化技术文本会破坏命令、版本、短链和 URL,即使输出看起来更漂亮。

常见问题

文本会上传到哪里吗?

不会。保护、分类和规范化都只在你的浏览器中运行。

会自动保护哪些内容?

默认会保护 URL、邮箱、日期、时间、版本、ID、文件路径、CLI 参数、代码块、行内代码和基础标记。

为什么不直接把每个连字符减号都替换掉?

因为 ASCII 连字符减号可能代表单词连接、范围短横线、括号中的断开标记或数学减号。盲目替换常常会破坏真实数据。

会把日文长音符改掉吗?

默认不会。你可以选择把半角长音符规范化为全角形式,但工具不会把长音符改成破折号。

支持多语言或 RTL 文本吗?

支持。输入和输出会自动处理文本方向,页面也为后续从英文翻译到其他语言预留了结构。

遇到歧义情况会怎样?

默认会保留并列入检查清单。若你的风格规范偏向激进规范化,也可以切换到更强模式。

提示

  • 保护规则是优先安全的启发式判断。如果你确实想在受保护的标记内部规范化,请先关闭保护。
  • 激进规范化可能与内部风格、法律文书规则或领域内符号规范冲突。
  • 共享 URL 只包含设置,不包含输入或输出文本。