HTML to Text Converter (Tag ਹਟਾਉਣਾ ਅਤੇ line formatting)

HTML ਤੋਂ ਪੜ੍ਹਨਯੋਗ body text ਕੱਢੋ, paragraph/list format ਕਰੋ ਅਤੇ script/style block ਆਪਣੇ ਆਪ ਹਟਾਓ।

Entity decoding ਅਤੇ link, image, table handling ਚੁਣੋ, ਫਿਰ ਇੱਕੇ flow ਵਿੱਚ ਨਤੀਜਾ ਕਾਪੀ ਜਾਂ ਡਾਊਨਲੋਡ ਕਰੋ।

ਤੁਹਾਡਾ ਇਨਪੁੱਟ ਇਸ ਬ੍ਰਾਊਜ਼ਰ ਵਿੱਚ ਸਥਾਨਕ ਤੌਰ 'ਤੇ ਪ੍ਰੋਸੈਸ ਹੁੰਦਾ ਹੈ ਅਤੇ ਕਦੇ ਵੀ ਸਰਵਰ ਨੂੰ ਨਹੀਂ ਭੇਜਿਆ ਜਾਂਦਾ।

HTML tag ਹਟਾਓ ਅਤੇ ਕੇਵਲ ਲਿਖਤ ਕੱਢੋ

Input ਅਤੇ output ਪਾਸੇ-ਪਾਸੇ ਦਿਖਾਏ ਜਾਂਦੇ ਹਨ, ਇਸ ਲਈ ਤੁਸੀਂ ਘੱਟ trial and error ਨਾਲ line-break rule ਅਤੇ option ਠੀਕ ਕਰ ਸਕਦੇ ਹੋ।

ਇਹ ਟੂਲ ਕੀ ਕਰਦਾ ਹੈ

  • HTML tag ਹਟਾਉਂਦਾ ਹੈ
  • Paragraph ਅਤੇ list ਲਈ line break format ਕਰਦਾ ਹੈ
  • Script/style ਹਮੇਸ਼ਾਂ ਹਟਾਉਂਦਾ ਹੈ ਅਤੇ ਚਾਹੋ ਤਾਂ entity decode ਕਰਦਾ ਹੈ

ਵਰਤੋਂ ਦਾ ਤਰੀਕਾ

  1. HTML ਪੇਸਟ ਕਰੋ (ਜਾਂ file ਲੋਡ ਕਰੋ)।
  2. ਲੋੜ ਹੋਵੇ ਤਾਂ formatting option ਬਦਲੋ।
  3. Convert ਕਰੋ, ਫਿਰ ਨਤੀਜਾ ਕਾਪੀ ਕਰੋ ਜਾਂ .txt ਵਜੋਂ ਸੇਵ ਕਰੋ।

ਨਮੂਨਾ

ਸਟੈਂਡਰਡ ਨਿਯਮ

ਇਨਪੁੱਟ (HTML)

<article><h2>ਸੂਚਨਾ</h2><p>Finite Field<br>ਵਿੱਚ ਤੁਹਾਡਾ ਸਵਾਗਤ ਹੈ</p><ul><li>ਪਛਾਣ</li><li>ਵਰਤੋਂ</li></ul></article>

ਆਉਟਪੁੱਟ (Text)

ਸੂਚਨਾ

Finite Field
ਵਿੱਚ ਤੁਹਾਡਾ ਸਵਾਗਤ ਹੈ

- ਪਛਾਣ
- ਵਰਤੋਂ

ਮਿਨੀਮਲ ਨਿਯਮ

ਇਨਪੁੱਟ (HTML)

<div><p>A</p><p>B</p></div>

ਆਉਟਪੁੱਟ (Text)

A
B

ਵੇਰਵੇਦਾਰ ਨਿਯਮ

ਇਨਪੁੱਟ (HTML)

<ol><li>ਲੋੜਾਂ ਤੈਅ ਕਰੋ</li><li>ਲਾਗੂ ਕਰੋ</li></ol>

ਆਉਟਪੁੱਟ (Text)

1. ਲੋੜਾਂ ਤੈਅ ਕਰੋ
2. ਲਾਗੂ ਕਰੋ

ਫਾਰਮੈਟਿੰਗ ਚੋਣਾਂ

  • Line-break rule ਬਦਲੋ: Standard / Minimal / Detailed.
  • ਚੁਣੋ ਕਿ HTML entity decode ਕਰਨੀ ਹੈ ਜਾਂ ਨਹੀਂ।
  • Space collapse ਅਤੇ max consecutive line break ਨਾਲ ਪੜ੍ਹਨਯੋਗਤਾ ਠੀਕ ਕਰੋ।
  • Comment, link, image ਅਤੇ table ਦੇ handling ਨੂੰ ਨਿਯੰਤਰਿਤ ਕਰੋ।

ਨੋਟ: <script> ਅਤੇ <style> ਹਮੇਸ਼ਾਂ ਹਟਾਏ ਜਾਂਦੇ ਹਨ।

ਰੂਪਾਂਤਰਨ ਦੇ ਨਿਯਮ

Line break ਵਿੱਚ ਬਦਲੇ ਜਾਣ ਵਾਲੇ element (Standard)

  • <br>
  • <p>, heading (h1-h6), <li>
  • <div>, <section>, <article>, <header>, <footer>, <blockquote>

ਹਮੇਸ਼ਾਂ ਹਟਾਏ ਜਾਣ ਵਾਲੇ element

  • <script>...</script>
  • <style>...</style>
  • ਲੋੜ ਹੋਵੇ ਤਾਂ <noscript> ਵੀ ਹਟਾਇਆ ਜਾ ਸਕਦਾ ਹੈ।

List formatting ਉਦਾਹਰਨਾਂ

  • <ul><li>ਆਈਟਮ</li></ul> -> - ਆਈਟਮ
  • <ol><li>ਆਈਟਮ</li></ol> -> - ਆਈਟਮ (ਸਟੈਂਡਰਡ/ਮਿਨੀਮਲ)
  • <ol><li>ਆਈਟਮ</li></ol> -> 1. ਆਈਟਮ (ਵੇਰਵੇਦਾਰ)

FAQ

Line break ਅਜੀਬ ਲੱਗ ਰਹੇ ਹਨ

ਇਹ ਟੂਲ <p>/<br>/<li> ਵਰਗੇ tag ਨੂੰ line break ਵਿੱਚ ਬਦਲਦਾ ਹੈ। ਆਪਣੇ target format ਦੇ ਨੇੜੇ ਜਾਣ ਲਈ Line Break Rule ਅਤੇ Max Consecutive Line Breaks ਠੀਕ ਕਰੋ।

ਕੀ script/style block ਰੱਖੇ ਜਾਂਦੇ ਹਨ?

ਨਹੀਂ। <script> ਅਤੇ <style> ਹਮੇਸ਼ਾਂ ਹਟਾਏ ਜਾਂਦੇ ਹਨ।

&amp; ਵਰਗੀ entity ਦਾ ਕੀ ਹੁੰਦਾ ਹੈ?

ਤੁਸੀਂ decode on/off ਚੁਣ ਸਕਦੇ ਹੋ। ਜਦੋਂ ਤੁਸੀਂ &amp; ਨੂੰ & ਵਿੱਚ ਬਦਲਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ decoding ਚਾਲੂ ਕਰੋ।

ਵਾਧੂ line break ਅਤੇ space ਕਿਵੇਂ ਘਟਾਈਆਂ ਜਾਣ?

Minimal rule ਵਰਤੋ, Collapse Spaces ਚਾਲੂ ਰੱਖੋ, ਅਤੇ Max Consecutive Line Breaks ਨੂੰ 1 ਜਾਂ 2 'ਤੇ ਰੱਖੋ।

ਕੀ ਮੈਂ link text ਨਾਲ URL ਵੀ ਰੱਖ ਸਕਦਾ ਹਾਂ?

ਹਾਂ। Link Handling ਨੂੰ Text + URL 'ਤੇ ਸੈੱਟ ਕਰੋ।

ਨੋਟਸ

  • ਟੂਲ input HTML source ਨੂੰ parse ਕਰਦਾ ਹੈ; ਇਹ script ਚਲਾਉਂਦਾ ਨਹੀਂ ਅਤੇ ਨਾ ਹੀ ਪੂਰੀ browser rendering output ਨੂੰ ਦੁਹਰਾਉਂਦਾ ਹੈ।
  • ਬਹੁਤ ਵੱਡੇ ਇਨਪੁੱਟ ਨੂੰ convert ਕਰਨ ਵਿੱਚ ਹੋਰ ਸਮਾਂ ਲੱਗ ਸਕਦਾ ਹੈ।
  • Input ਸਮੱਗਰੀ URL query parameter ਵਿੱਚ ਸਟੋਰ ਨਹੀਂ ਹੁੰਦੀ।