مبدل HTML به متن (حذف تگها و تمیز کردن شکست خطوط)
استخراج متن خوانا از HTML چسبانده شده. پاراگرافها و لیستها شکست خط طبیعی خود را حفظ میکنند، اسکریپتها/استایلها همیشه حذف میشوند و رمزگشایی موجودیتها اختیاری است.
تنظیمات قالببندی
نکته: تگهای <script> و <style> همیشه حذف میشوند.
باز کردن تنظیمات قالببندی
حذف تگهای HTML و استخراج متن تمیز
پاکسازی تگهای HTML
حذف نشانهگذاریها و نگهداری فقط متن خوانای بدنه.
شکست خط پاراگراف و لیست
در نظر گرفتن <p>/<br>/<li> به عنوان شکست خط طبیعی.
حذف اسکریپت/استایل + تبدیل موجودیتها
اسکریپت و استایل همیشه حذف شده و رمزگشایی موجودیتها اختیاری است.
نحوه استفاده
HTML را در کادر ورودی بچسبانید یا یک فایل بارگذاری کنید.
قوانین شکست خط و نحوه برخورد با لینکها/تصاویر را انتخاب کنید.
روی تبدیل کلیک کنید، سپس نتیجه را کپی یا به صورت فایل txt. دانلود کنید.
نمونه
<article>
<h2>Headline</h2>
<p>HTML را برای تبدیل اینجا بچسبانید.</p>
<ol>
<li>مرحله ۱</li>
<li>مرحله ۲</li>
</ol>
<p>جزئیات در <a href="https://example.com">سایت رسمی</a>.</p>
</article>
Headline HTML را برای تبدیل اینجا بچسبانید. • مرحله ۱ • مرحله ۲ جزئیات در سایت رسمی.
Headline HTML را برای تبدیل اینجا بچسبانید. جزئیات در سایت رسمی. • مرحله ۱ • مرحله ۲
Headline HTML را برای تبدیل اینجا بچسبانید. 1. مرحله ۱ 2. مرحله ۲ جزئیات در سایت رسمی.
قوانین تبدیل
شکست خطوط و موارد حذف شده طبق این قوانین عمل میکنند.
عناصری که به شکست خط تبدیل میشوند (استاندارد)
- <br>
- <p>...</p>
- عناوین: <h1> تا <h6>
- لیستها: <li> (یک نشانگر اضافه میکند)
- بلوکها: <div>, <section>, <article>, <header>, <footer>, <blockquote>
عناصری که اغلب خط خالی اضافه میکنند
- </p>, </section>, </article> (ترکیب شده با حداکثر شکست خط)
همیشه حذف میشوند
- <script>...</script>
- <style>...</style>
- <noscript>...</noscript>
مثالهای قالببندی لیست
- <ul><li>Item</li></ul> ← • Item
- <ol><li>Item</li></ol> → 1. Item (در حالت جزئیات)
نکات و ترفندها
فقط سمت کلاینت
ورودی شما در مرورگر باقی میماند و هرگز آپلود نمیشود.
حذف اسکریپت و استایل
برای ایمنی و خوانایی، تگهای script و style همیشه حذف میشوند.
گزینههای خروجی جدول
فرمت پیشفرض TSV است، اما گزینههای فاصله یا تکخطی نیز در دسترس هستند.
سؤالات متداول
شکست خطوط عجیب به نظر میرسد
تگهای <p>، <br> و <li> به شکست خط تبدیل میشوند. قوانین شکست خط (استاندارد/حداقلی/جزئیات) را تغییر دهید.
آیا اسکریپتها و استایلها حفظ میشوند؟
خیر. برای امنیت و خوانایی، <script> و <style> همیشه حذف میشوند.
چه اتفاقی برای موجودیتهایی مثل & میافتد؟
میتوانید انتخاب کنید که رمزگشایی شوند یا خیر. گزینه «رمزگشایی موجودیتهای HTML» را فعال کنید تا & به & تبدیل شود.
من شکست خطوط و فواصل کمتری میخواهم
از شکست خط «حداقلی» استفاده کنید، گزینه «یکپارچهسازی فواصل» را فعال کنید و حداکثر شکست خط را روی ۱ یا ۲ قرار دهید.
آیا میتوانم آدرس لینکها (URL) را هم نگه دارم؟
مدیریت لینکها را روی «متن + آدرس» قرار دهید تا هر دو حفظ شوند.