Կրկնվող տողերի հեռացնող
Հեռացրու կրկնվող տողերը տեղադրված ցանկերից՝ keep order, ascending/descending sort, case rules, trim և blank-line handling անջատիչներով։
Այն նաև աջակցում է Unicode-aware համեմատությանը, արագ պատճենմանը/ներբեռնմանը և բազմալեզու ցանկերի մաքրմանը։
Ինչ է անում այս գործիքը
Օգտագործիր այն մեկ-տողով-մեկ-կետ ցանկերի dedupe-ի համար, օրինակ՝ tags, emails, URLs, product codes կամ copy արված research notes։ Կարող ես առաջին հանդիպումը թողնել հենց իր տեղում կամ sort անել եզակի արդյունքը՝ ավելի մաքուր փոխանցման համար։
Ինչպես օգտագործել
- Տեղադրիր ցանկը մուտքի դաշտում՝ մեկ տարր յուրաքանչյուր տողում։
- Անհրաժեշտության դեպքում կարգավորիր order-ը, case matching-ը, trim-ը և blank-line handling-ը։
- Սեղմիր Remove duplicates, հետո պատճենիր կամ ներբեռնի՛ր մաքրված արդյունքը։
Օրինակներ
Հեռացնել կրկնությունները՝ պահպանելով սկզբնական կարգը
Մուտք
Alpha Beta Alpha Gamma Beta
Արդյունք
Alpha Beta Gamma
Անտեսել case-ը + trim
Մուտք
Alpha alpha ALPHA Beta
Արդյունք
Alpha Beta
Sort անել՝ միաժամանակ հեռացնելով կրկնությունները
Մուտք
item 10 item 2 item 2 item 1
Արդյունք
item 1 item 2 item 10
Բառարան
Համեմատության key
Ներքին համեմատության արժեքը trim-ից, Unicode normalization-ից և case handling-ից հետո։ Այն առանձին է սկզբնական ցուցադրվող տողից։
Trim
Համեմատությունից առաջ հեռացնում է յուրաքանչյուր տողի սկզբի և վերջի բացատները։ Այն չի վերագրում միջանկյալ բացատները։
NFC
Unicode normalization-ի ձևերից մեկը, որը նվազեցնում է տեսքով նույն, բայց ներսում տարբեր ներկայացում ունեցող նիշերի տարբերությունները։
Locale-aware sort
Տեսակավորում, որը հետևում է ակտիվ էջի լեզվին, ոչ թե code point-երի մաքուր կարգին։ Սա կարող է փոխել accents-ների և խառը գրությունների դասավորությունը։
ՀՏՀ
Պահո՞ւմ է արդյոք սկզբնական կարգը։
Այո։ Keep order-ը լռելյայն տարբերակն է։ Գործիքը պահում է յուրաքանչյուր տողի միայն առաջին հանդիպումը և պահպանում է այդ առաջին հայտնվելու կարգը, եթե չանցնես ascending կամ descending sort-ի։
Կարո՞ղ եմ case-ը անտեսել բազմալեզու տեքստի համար։
Այո, բայց case handling-ը հետևում է ընթացիկ էջի լեզվին։ Խառը լեզուներով ցանկերի դեպքում, հատկապես locale-specific տառերով, արդյունքները կարող են տարբերվել սպասվածից։
Ի՞նչ է փոխվում, երբ trim-ը միացված է։
Համեմատությունից առաջ հեռացվում են սկզբի և վերջի բացատները։ Դրա շնորհիվ `Alpha`-ն ու ` Alpha `-ն կհամարվեն նույն տողը։
Ինչպե՞ս են մշակվում դատարկ տողերը։
Լռելյայն դատարկ տողերը բացառվում են։ Եթե դա անջատես, դատարկ տողերն էլ կհամեմատվեն, և կրկնվող դատարկ տողերը կսեղմվեն մեկ պահված դատարկ տողի։
Տեսքով նույն տողերը դեռ կարո՞ղ են չհամընկնել։
Այո։ NFC normalization-ը օգնում է շատ composed/decomposed տարբերությունների դեպքում, բայց zero-width նիշերն ու width differences-ը դեռ կարող են տողերը տարբեր պահել։
Իմ մուտքը սերվե՞ր է ուղարկվում։
Ոչ։ Ամեն ինչ աշխատում է տեղային՝ բրաուզերում, և ոչ մուտքային տեքստը, ոչ արդյունքը URL-ում չեն պահվում։
Նշումներ
- Case-ignore համընկնումը կախված է ընթացիկ էջի լեզվից, ուստի խառը լեզվով ցանկերը լրացուցիչ ստուգման կարիք ունեն։
- Zero-width նիշերն ու full-width/half-width տարբերությունները ավտոմատ չեն միավորվում։ Եթե կրկնությունները դեռ տեսանելի են, ստուգիր տեքստը անտեսանելի նիշերի գործիքով։
- Այս տարբերակը պահում է յուրաքանչյուր տողի առաջին հանդիպումը։ Keep-the-last-occurrence կանոն չի առաջարկվում։