ہائفن / ڈیش نارملائزر

ترتیب out hyphens, en dashes, em dashes, minus signs, and Japanese long sound marks by role instead of by shape alone.

URLs، تاریخیں، ورژنز، CLI فلیگز، اور کوڈ بذریعہ ڈیفالٹ محفوظ رہتے ہیں، اور سب کچھ آپ کے براؤزر کے اندر چلتا ہے۔

آپ کا متن اسی ڈیوائس پر رہتا ہے۔ نہ کوئی اپ لوڈ، نہ اکاؤنٹ، نہ سرور سائیڈ پراسیسنگ۔

نارملائز punctuation-like dashes without breaking structured data

یہ ٹول Unicode میں ایک جیسے دکھنے والے حروف کو مختلف کردار سمجھتا ہے۔ یہ technical tokens کو جوں کا توں رکھتا ہے اور اداراتی متن، کثیر لسانی مواد، اور مخلوط جاپانی تحریر کو معیاری بنانے میں مدد دیتا ہے۔

استعمال کا طریقہ

  1. وہ متن چسپاں کریں جسے آپ صاف کرنا چاہتے ہیں۔
  2. منتخب a preset and adjust the confidence level if the text is ambiguous.
  3. جائزہ how many items were changed, protected, or left for manual review.
  4. کاپی the result, save the report, or send the result back for another pass.

مثالیں

رینج اور جملہ معترضہ وقفوں کو الگ الگ نشانوں میں بدلیں

ان پٹ
ابواب 10-12 - نظرِ ثانی شدہ ایڈیشن
آؤٹ پٹ
ابواب 10–12 — نظرِ ثانی شدہ ایڈیشن

استعمال the Unicode minus sign for math

ان پٹ
درجہ حرارت -5 تک گر گیا اور x-1 = 0۔
آؤٹ پٹ
درجہ حرارت −5 تک گر گیا اور x−1 = 0۔

تاریخوں، URLs، اور CLI فلیگز کو محفوظ رکھیں

ان پٹ
اجرا 2026-03-12، URL https://example.com/my-tool، فلیگ --dry-run
آؤٹ پٹ
گرد و نواح کا متن نارملائز ہونے کے باوجود تاریخ، URL، اور CLI فلیگ جوں کے توں رہتے ہیں۔

جاپانی long sound mark کو dash سے الگ رکھیں

ان پٹ
スーパー - A-B - 3-5 کلوگرام
آؤٹ پٹ
スーパー ― A‐B ― 3–5 کلوگرام

اہم اصطلاحات

ہائفن

کسی لفظ یا مرکب اصطلاح کے اندر آنے والی جوڑنے والی علامت۔ Unicode اس کردار کے لیے U+2010 جیسے مخصوص hyphen حروف فراہم کرتا ہے۔

این ڈیش / ایم ڈیش

ڈیش علامات جو نظامِ تحریر اور style guide کے مطابق رینج، وقفے، یا جملہ معترضہ کے لیے عام طور پر استعمال ہوتی ہیں۔

منفی علامت

ریاضی میں منفی یا تفریق کی علامت۔ Unicode اس کردار کے لیے U+2212 مختص کرتا ہے۔

لانگ ساؤنڈ مارک

ایک جاپانی حرف جو کاتا کانا الفاظ میں مصوتوں کی آواز بڑھانے کے لیے استعمال ہوتا ہے۔ یہ dash جیسی چیز نہیں ہے۔

Unicode کی حقیقت سے نوٹس

  • ASCII hyphen-minus ٹائپ کرنا آسان ہے، مگر یہ اوقاف کے کئی مختلف کرداروں کو ایک ہی حرف میں سمیٹ دیتا ہے۔
  • جاپانی ー اور جاپانی طرز کا ― کچھ فونٹس میں ایک جیسے لگ سکتے ہیں، حالانکہ ان کے code points مختلف ہوتے ہیں۔
  • technical متن کو حد سے زیادہ نارملائز کرنا commands، versions، slugs، اور URLs کو خراب کر سکتا ہے، چاہے نتیجہ دیکھنے میں بہتر لگے۔

اکثر پوچھے جانے والے سوالات

کیا میرا متن کہیں اپ لوڈ ہوتا ہے؟

نہیں۔ حفاظت، درجہ بندی، اور نارملائزیشن سب کچھ صرف آپ کے براؤزر میں چلتا ہے۔

خودکار طور پر کیا محفوظ ہوتا ہے؟

بذریعہ ڈیفالٹ یہ ٹول URLs، ای میلز، تاریخیں، اوقات، ورژنز، IDs، فائل پاتھ، CLI فلیگز، کوڈ بلاکس، اِن لائن کوڈ، اور بنیادی مارک اپ کو محفوظ رکھتا ہے۔

ہر hyphen-minus کو بغیر سوچے سمجھے کیوں نہ بدل دیا جائے؟

کیونکہ ASCII hyphen-minus کبھی لفظی ہائفن، کبھی رینج ڈیش، کبھی جملہ معترضہ ڈیش، اور کبھی ریاضیاتی منفی علامت کا مطلب دے سکتا ہے۔ اندھا دھند تبدیلی اکثر اصل ڈیٹا خراب کر دیتی ہے۔

کیا یہ جاپانی long sound mark کو بدل دے گا؟

ڈیفالٹ طور پر نہیں۔ آپ چاہیں تو half-width long sound mark کو full-width شکل میں نارملائز کر سکتے ہیں، مگر یہ ٹول long sound mark کو dash میں تبدیل نہیں کرے گا۔

کیا یہ کثیر لسانی یا RTL متن کے ساتھ کام کرتا ہے؟

جی ہاں۔ اِن پٹ اور آؤٹ پٹ خودکار متن کی سمت استعمال کرتے ہیں، اور صفحہ اس طرح بنایا گیا ہے کہ آئندہ تراجم کے لیے انگریزی ماخذ بن سکے۔

غیر واضح صورتوں کے ساتھ کیا ہوتا ہے؟

بذریعہ ڈیفالٹ انہیں برقرار رکھا جاتا ہے اور جائزے کے لیے فہرست میں شامل کیا جاتا ہے۔ اگر آپ کی style guide زیادہ جارحانہ نارملائزیشن چاہتی ہو تو آپ زیادہ مضبوط موڈ پر جا سکتے ہیں۔

نوٹس

  • حفاظتی قواعد ایسے heuristic ہیں جو پہلے سلامتی کو ترجیح دیتے ہیں۔ اگر آپ واقعی کسی محفوظ token کے اندر نارملائز کرنا چاہتے ہیں تو پہلے وہ حفاظت بند کریں۔
  • زیادہ جارحانہ نارملائزیشن آپ کے house style، قانونی مسودہ نویسی کے قواعد، یا کسی مخصوص domain کی notation سے ٹکرا سکتی ہے۔
  • شیئر کیا گیا URL صرف settings پر مشتمل ہوتا ہے۔ اس میں کبھی بھی اِن پٹ یا آؤٹ پٹ متن شامل نہیں ہوتا۔