Lọc trùng dữ liệu là thao tác sàn lọc ký tự trùng lặp trong bảng dữ liệu nhằm tiết kiệm dung lượng lưu trữ cũng như khả năng ký tự bị dư thừa hay thiếu sót trong bảng dữ liệu cần thiết.
Một số lợi ích việc lọc dữ liệu bị trùng lặp:
Hướng dẫn nhanh:
Hướng dẫn chi tiết:
Bước 1: Chọn vùng dữ liệu trong bảng tính > Chọn Định dạng > Chọn Định dạng theo điều kiện để hiển thị bảng Quy tắc định dạng theo điều kiện.
Bước 2: Chọn vùng áp dụng > Trong mục Quy tắc định dạng chọn Công thức tùy chỉnh là > Nhập công thức =Countif(A:A;A1)>1 như hình > Lựa chọn kiểu định dạng > Chọn Đã xong.
Lưu ý:
Bước 3: Kết quả bạn đã dễ dàng thấy được các dữ liệu trùng nhau.
Bước 1: Chọn ô kế bên dữ liệu muốn tìm dữ liệu trùng > Nhập công thức =countif(A:A;A1)=1 Như hình.
Bước 2: Nhấn Enter và kéo công thức xuống hết nguyên cột, như hình.
Bước 3: Để lọc dữ liệu TRUE để lấy kết quả không trùng. Bạn chèn thêm một hàng trên như hình.
Bước 4: Chọn hàng vừa chèn > Chọn Dữ liệu > Chọn Bộ lọc như hình.
Bước 5: Chọn biểu tượng bộ lọc vừa khởi tạo > Bỏ chọn mục FALSE > Chọn OK, như hình.
Bước 6: Kết quả thu được khi giữ lại giá trị không trùng TRUE. Bạn có thể làm tương tự với giá trị FALSE.
Bước 1: Chọn một ô bất kỳ trong bảng dữ liệu > Nhập hàm =Unique(A2:B8) như hình.
Bước 2: Nhấn Enter > Kết quả hiển thị như hình.
Lưu ý:
Bước 1: Trong bảng dữ liệu > Nhập hàm =IF(COUNTIF($A$2:A2;A2)=1;A2;"Kết quả trùng") như hình vào ô kế bên dữ liệu muốn sàn lọc.
Bước 2: Nhấn Enter và kéo công thức xuống hết nguyên cột, như hình.
Bước 3: Bạn khởi tạo bộ lọc bằng cách > Chọn hàng đầu tiên hàng A1 > Chọn Dữ liệu > Chọn Bộ lọc.
Bước 4: Kết quả sau khi sàn lọc.
Bước 1: Bạn chọn Tiện ích bổ sung > Chọn Tải tiện ích bổ sung
Bước 2: Bạn tìm từ khóa "remove duplicates" và chọn tiện ích của tác giả EXPAND9 như hình. Vì mình thấy của EXPAND9 là ngon và dễ dùng nhất.
Bước 3: Bạn nhấp vào nút Cài đặt.
Bước 4: Bạn nhấp lần lượt nút Tiếp tục > Chọn gmail của bạn > Cho phép > Xong.
Bước 5: Bạn quay lại trang Google Sheet có dữ liệu trùng lặp > Chọn Tiện ích bổ sung > Chọn Remove Duplicates > Chọn Start để bắt đầu lọc dữ liệu trùng lặp.
Bước 6: Bạn nhấp vào nút Select columns (Chọn cột) > Kick chọn hoặc bỏ các cột chứa dữ liệu mà bạn muốn lọc > Chọn Save (Lưu).
Bước 7: Highlight hoặc xóa dữ liệu trùng lặp Google Sheet. Nếu bạn để Highlight > nhấp Search bạn sẽ các có hàng dữ liệu bị trùng lần thứ 2 trở lên bị bôi vàng như hình này.