Usuwanie duplikatów z CSV (usuwanie duplikatów według kolumn kluczowych)

Usuwaj zduplikowane wiersze z CSV na podstawie wybranych kolumn kluczowych. Wybierz tryb pierwsze wygrywa, ostatnie wygrywa albo scalanie niepustych wartości do praktycznej deduplikacji.

Bez rejestracji, bezpłatnie. Przetwarzanie odbywa się w przeglądarce, a dane nie są przechowywane.

Bez rejestracji / Bezpłatne
Przetwarzane w przeglądarce
Brak przechowywania danych

Wejściowy CSV

Zacznij od wczytania pliku, wklejenia albo przykładowych danych.

Kolumny kluczowe i reguła duplikatów

Wybierz jedną albo więcej kolumn kluczowych i określ, jak zachować wiersze po wykryciu duplikatów.

Wynik (podgląd, metryki, pobieranie)

Sprawdź metryki podsumowujące i wyeksportuj wiersze po deduplikacji, tylko wiersze zduplikowane albo CSV z podsumowaniem grup.

Jak używać

  1. Wczytaj plik CSV (albo wklej tekst CSV)
  2. Wybierz kolumny kluczowe używane do wykrywania duplikatów
  3. Wybierz tryb first/last/merge, uruchom deduplikację i pobierz wynik

FAQ

Który wiersz zostaje zachowany, gdy istnieją duplikaty?

Możesz wybrać first-win (zachowaj pierwszy wiersz), last-win (zachowaj ostatni wiersz) albo scalenie niepustych wartości. W przypadku konfliktów przy scalaniu wybierz pierwszy, ostatni albo listę ostrzeżeń.

Czy mogę ignorować wielkość liter?

Tak. Przełącz opcję wielkości liter w ustawieniach zaawansowanych, a zostanie zastosowana przy porównaniu kluczy.

Czy mogę zobaczyć liczby podsumowujące?

Karta wyników pokazuje liczbę wierszy oryginalnych, liczbę wierszy po deduplikacji, liczbę usuniętych wierszy i liczbę grup duplikatów.

Czy mogę wybrać wiele kolumn kluczowych?

Tak. Wiersze są traktowane jako duplikaty, gdy zgadza się kombinacja wybranych kolumn kluczowych.

Mój CSV jest uszkodzony (Shift_JIS).

Przełącz kodowanie między UTF-8 i Shift_JIS, a następnie ponownie wczytaj plik.

Dlaczego otrzymuję zero duplikatów?

Sprawdź wybór kolumn kluczowych, ustawienie przycinania spacji, ustawienie wielkości liter oraz obsługę pustych kluczy.

Uwagi

  • Ostrożnie obchodź się z danymi osobowymi w kolumnach kluczowych.
  • Przy użyciu trybu scalania sprawdź konflikty przed zatwierdzeniem wyniku.
  • Błędy niezgodności kolumn są często powodowane przez brak zamykającego cudzysłowu.