連字號/破折號正規化器

依角色而不是只看外形來整理連字號、短破折號、長破折號、減號與日文長音符。

URL、日期、版本、CLI 参数和代码默认受保护,所有处理都在你的浏览器中完成。

你的文本只保留在这个设备上。没有上传、没有账户、也没有服务器端处理。

在不破壞結構資料的前提下正規化類標點破折號

这个工具把 Unicode 中外观相似的字符视为不同角色。它会保留技术标记的原样,同时帮助你统一编辑文本、多语言内容和日文混排文本。

使用方式

  1. 貼上要整理的文字。
  2. 若文字有歧義,請選擇預設並調整信心等級。
  3. 檢視變更、保護與待人工檢查項目數量。
  4. 复制结果、保存报告,或把结果再送进下一轮处理。

示例

把范围和括号中的断开标记分开

输入
第 10-12 章 - 修订版
输出
第 10–12 章 — 修订版

数学中使用 Unicode 减号

输入
温度降到 -5,x-1 = 0。
输出
温度降到 −5,x−1 = 0。

保护日期、URL 和 CLI 参数

输入
发布 2026-03-12,URL https://example.com/my-tool,参数 --dry-run
输出
日期、URL 和 CLI 参数保持不变,周围的正文会被规范化。

让日文长音符与破折号分开

输入
- A - B - 3 - 5公斤
输出
=================================================================================================== ==========================================================================

关键词

连字符

单词或复合词内部的连接符。Unicode 提供了专门的连字符字符,如 U+2010。

en dash / em dash

常用于范围、断开或括号内停顿的短横线,具体使用取决于书写系统和风格指南。

减号

数学中的负号或减号。Unicode 为这个角色分配了 U+2212。

长音符

日文片假名中用于延长元音的字符。它并不等同于破折号。

Unicode 现实小知识

  • ASCII 连字符减号虽然好打,但会把多种不同的标点角色压成同一个字符。
  • 長音符號和日式破折號在某些字型裡看起來很像,但它們仍然是不同的碼位。
  • 过度规范化技术文本会破坏命令、版本、短链和 URL,即使输出看起来更漂亮。

常見問題

我的文字會上傳到哪裡嗎?

不會。保護、分類與正規化都只在您的瀏覽器中執行。

会自动保护哪些内容?

默认会保护 URL、邮箱、日期、时间、版本、ID、文件路径、CLI 参数、代码块、行内代码和基础标记。

为什么不直接把每个连字符减号都替换掉?

因为 ASCII 连字符减号可能代表单词连接、范围短横线、括号中的断开标记或数学减号。盲目替换常常会破坏真实数据。

会把日文长音符改掉吗?

默认不会。你可以选择把半角长音符规范化为全角形式,但工具不会把长音符改成破折号。

支持多语言或 RTL 文本吗?

支持。输入和输出会自动处理文本方向,页面也为后续从英文翻译到其他语言预留了结构。

遇到歧义情况会怎样?

默认会保留并列入检查清单。若你的风格规范偏向激进规范化,也可以切换到更强模式。

備註

  • 保護規則是以安全為優先的啟發式判定。
  • 激进规范化可能与内部风格、法律文书规则或领域内符号规范冲突。
  • 共享 URL 只包含设置,不包含输入或输出文本。