CSV duplicate-ների հեռացնող (հեռացնել կրկնությունները key սյունակներով)

Հեռացրու կրկնվող տողերը CSV-ից՝ ընտրված key սյունակներով։ Գործնական duplicate-ների հեռացման համար ընտրիր first-win, last-win կամ դատարկ չլինող արժեքների merge տարբերակ։

Գրանցում պետք չէ, անվճար է։ Մշակումը մնում է քո բրաուզերում, և տվյալները չեն պահվում։

Առանց գրանցման / Անվճար
Մշակվում է բրաուզերում
Տվյալների պահպանում չկա

Մուտքային CSV

Սկսիր ֆայլի վերբեռնումից, տեղադրումից կամ օրինակային մուտքից։

Key սյունակներ և duplicate-ների կանոն

Ընտրիր մեկ կամ մի քանի key սյունակ և սահմանիր, թե ինչպես պահել տողերը duplicate-ներ հայտնաբերելիս։

Արդյունք (նախադիտում, մետրիկաներ, ներբեռնում)

Ստուգիր ամփոփ մետրիկաները և արտահանիր duplicate-ներից մաքրված տողերը, միայն duplicate տողերը կամ խմբերի ամփոփ CSV-ը։

Օգտագործման եղանակը

  1. Վերբեռնիր CSV ֆայլ (կամ տեղադրիր CSV տեքստ)
  2. Ընտրիր key սյունակները, որոնք օգտագործվում են duplicate-ների հայտնաբերման համար
  3. Ընտրիր first/last/merge ռեժիմը, գործարկիր dedupe-ը և ներբեռնիր արդյունքը

ՀՏՀ

Ո՞ր տողն է պահպանվում, երբ կան duplicates։

Կարող ես ընտրել first-win (պահել առաջին տողը), last-win (պահել վերջին տողը) կամ merge դատարկ չլինող արժեքները։ Merge conflict-ի դեպքում ընտրիր first, last կամ warning list։

Կարո՞ղ եմ անտեսել մեծատառ/փոքրատառ տարբերությունը։

Այո։ Միացրու case տարբերակը advanced settings-ում, և այն կկիրառվի key-երի համեմատության համար։

Կարո՞ղ եմ տեսնել ամփոփիչ քանակները։

Արդյունքի քարտը ցույց է տալիս սկզբնական տողերը, dedupe-ից հետո մնացած տողերը, հեռացված տողերը և duplicate խմբերի քանակը։

Կարո՞ղ եմ ընտրել մի քանի key սյունակ։

Այո։ Տողերը համարվում են duplicate, երբ ընտրված key սյունակների համակցությունը համընկնում է։

Իմ CSV-ը կոտրված է երևում (Shift_JIS)։

Փոխիր կոդավորումը UTF-8-ի և Shift_JIS-ի միջև, ապա նորից բեռնի՛ր ֆայլը։

Ինչո՞ւ duplicate-ների քանակը 0 է։

Ստուգիր key սյունակների ընտրությունը, trim կարգավորումը, case կարգավորումը և blank-key մշակումն։

Նշումներ

  • Key սյունակներում եղած անձնական տվյալների հետ աշխատիր զգուշությամբ։
  • Merge ռեժիմն օգտագործելիս մինչև վերջնական արտահանումը ստուգիր conflict-ները։
  • Սյունակների անհամապատասխանության սխալները հաճախ առաջանում են չփակված quote-ներից։