हाइफ़न / डैश नॉर्मलाइज़र

हाइफ़न, en dash, em dash, माइनस चिह्न और Japanese long sound marks को केवल रूप के आधार पर नहीं, बल्कि भूमिका के आधार पर अलग करें।

URLs, dates, versions, CLI flags और code डिफ़ॉल्ट रूप से सुरक्षित रहते हैं, और सब कुछ आपके ब्राउज़र के अंदर चलता है।

आपका पाठ इसी device पर रहता है। कोई upload नहीं, कोई account नहीं, कोई server-side processing नहीं।

संरचित डेटा तोड़े बिना punctuation-जैसे dashes को normalize करें

यह साधन Unicode जैसे दिखने वाले चिह्नों को अलग-अलग भूमिकाओं के रूप में समझता है। यह तकनीकी tokens को जस का तस रखते हुए संपादकीय पाठ, बहुभाषी सामग्री और जापानी मिश्रित लेखन को मानकीकृत करने में मदद करता है।

कैसे उपयोग करें

  1. जिस पाठ को साफ़ करना है, उसे paste करें।
  2. एक प्रीसेट चुनें और यदि पाठ अस्पष्ट हो तो confidence level समायोजित करें।
  3. कितने आइटम बदले गए, सुरक्षित रहे, या हस्तचालित समीक्षा के लिए छोड़े गए, यह देखें।
  4. परिणाम कॉपी करें, रिपोर्ट सहेजें, या परिणाम को अगले चरण के लिए वापस भेजें।

उदाहरण

रेन्ज और कोष्ठकीय विरामों को अलग-अलग चिह्नों में बदलें

इनपुट
अध्याय 10-12 - संशोधित संस्करण
आउटपुट
अध्याय 10–12 — संशोधित संस्करण

गणित के लिए Unicode माइनस चिह्न का उपयोग करें

इनपुट
तापमान -5 तक गिर गया और x-1 = 0.
आउटपुट
तापमान −5 तक गिर गया और x−1 = 0.

तिथियाँ, URLs और CLI flags को सुरक्षित रखें

इनपुट
रिलीज़ 2026-03-12, URL https://example.com/my-tool, flag --dry-run
आउटपुट
तिथि, URL और CLI flag जस के तस रहते हैं, जबकि आसपास का गद्य सामान्यीकृत होता है।

जापानी लंबे स्वर चिह्नों को डैश से अलग रखें

इनपुट
スーパー - A-B - 3-5kg
आउटपुट
スーパー ― A‐B ― 3–5kg

मुख्य शब्द

हाइफ़न

शब्द या compound term के अंदर का connector। Unicode U+2010 जैसे dedicated hyphen characters देता है।

एन डैश / एम डैश

ऐसे डैश चिह्न जो लेखन प्रणाली और शैली-निर्देशिका के अनुसार रेन्ज, विराम या कोष्ठकीय ठहराव के लिए उपयोग होते हैं।

माइनस चिह्न

गणितीय ऋणात्मकता या घटाव का चिह्न। Unicode इस भूमिका के लिए U+2212 देता है।

लंबा स्वर चिह्न

Katakana शब्दों में स्वर ध्वनि बढ़ाने के लिए उपयोग होने वाला जापानी चरित्र। यह डैश जैसा नहीं है।

Unicode वास्तविकता से नोट्स

  • ASCII hyphen-minus टाइप करने में आसान है, लेकिन यह कई अलग-अलग विरामचिह्न भूमिकाओं को एक ही चरित्र में मिला देता है।
  • कुछ fonts में Japanese ー और Japanese-style ― एक जैसे दिख सकते हैं, फिर भी उनके code points अलग होते हैं।
  • तकनीकी पाठ को ज़्यादा सामान्यीकृत करने से commands, versions, slugs और URLs टूट सकते हैं, भले output बेहतर लगे।

अक्सर पूछे जाने वाले प्रश्न

क्या मेरा text कहीं upload होता है?

नहीं। सुरक्षा, वर्गीकरण और सामान्यीकरण सब केवल आपके browser में चलते हैं।

डिफ़ॉल्ट रूप से क्या protect होता है?

डिफ़ॉल्ट रूप से tool URLs, emails, dates, times, versions, IDs, file paths, CLI flags, code blocks, inline code और basic markup को सुरक्षित रखता है।

हर hyphen-minus को blind तरीके से क्यों न बदलें?

क्योंकि ASCII hyphen-minus एक शब्द हाइफ़न, रेन्ज डैश, कोष्ठकीय डैश या गणितीय माइनस चिह्न हो सकता है। अंधाधुंध बदलना अक्सर वास्तविक डेटा तोड़ देता है।

क्या यह Japanese long sound marks बदल देगा?

डिफ़ॉल्ट रूप से नहीं। आप half-width long sound mark को full-width form में सामान्यीकृत कर सकते हैं, लेकिन tool long sound marks को डैश में नहीं बदलता।

क्या यह multilingual या RTL text के साथ काम करता है?

हाँ। इनपुट और आउटपुट automatic text direction का उपयोग करते हैं, और page भविष्य के अनुवादों के लिए English स्रोत के रूप में भी डिज़ाइन की गई है।

अस्पष्ट मामलों का क्या होता है?

डिफ़ॉल्ट व्यवहार उन्हें सुरक्षित रखना और समीक्षा के लिए सूचीबद्ध करना है। यदि आपकी शैली-निर्देशिका आक्रामक सामान्यीकरण चाहती है, तो आप stronger mode पर जा सकते हैं।

नोट्स

  • सुरक्षा नियम सुरक्षा-प्रथम अनुमानों पर आधारित हैं। यदि आपको सचमुच किसी सुरक्षित token के अंदर सामान्यीकरण करना है, तो पहले वह सुरक्षा बंद करें।
  • आक्रामक सामान्यीकरण घर की शैली, कानूनी मसौदा-लेखन नियमों या क्षेत्र-विशिष्ट संकेत-लिपि से टकरा सकती है।
  • साझा URL में केवल सेटिंग्स होती हैं। इसमें इनपुट पाठ या आउटपुट पाठ कभी शामिल नहीं होता।