5 chức năng làm sạch dữ liệu đơn giản và hiệu quả trong Excel


Nguyễn Lan Phượng - 15/02/2019 - 0 comments

Trước khi bắt tay vào làm báo cáo hoặc trực quan dữ liệu, việc làm sạch dữ liệu (clean data) luôn khiến người dùng mất khá nhiều thời gian và công sức. Việc này có vai trò rất quan trọng trong việc tăng tính hiệu quả của việc phân tích số liệu. Dưới đây là 5 chức năng cực kỳ đơn giản nhưng hiệu quả trong Excel sẽ giúp giảm thời gian cho công việc loại bỏ các phần dữ liệu dư thừa và không có ý nghĩa.

Find and Replace

Đây là chức năng cho phép thay thế giá trị này bằng một giá trị khác. Tuy nhiên, ngoài việc thay thế dữ liệu đơn thuần, với Find and Replace, người dùng có thể thay thế định dạng hoặc thiết lập phạm vi tìm kiếm cụ thể. Để mở ra các phần tìm kiếm nâng cao, chúng ta chỉ cần bấm chọn mục Option trong cửa sổ Find and Replace:

Find and Replace ExcelConditional Formating

Chức năng này cho phép thiết lập các định dạng theo các điều kiện tự động. Ở khâu làm sạch dữ liệu, chúng ta có thể sử dụng Conditional Formating để phát hiện các giá trị trùng lặp trong bộ dữ liệu. Chức năng sẽ giúp đánh dấu (high light) các giá trị trùng lặp có thể được gọi ra tại vị trí sau:

Conditional Formating ExcelRemove Duplicate

Sau khi phát hiện các giá trị trùng lặp, chúng ta có thể loại bỏ các giá trị này với chức năng Remove Duplicate trên tab Data. Trong hộp thoại Remove Duplicate, chúng ta có thể tích chọn xem các giá trị sẽ bị loại bỏ khi trùng nhau trên các cột nào (ví dụ: muốn loại bỏ tất cả các dòng giống hệt nhau, ta chọn select all để lựa chọn tất cả các cột).

Chức năng Remove Duplicate sẽ giúp loại bỏ các dòng dữ liệu thừa, giúp cho kết quả tính toán hoặc trực quan dữ liệu sau này tăng mức độ tập trung và chính xác hơn.

Remove Duplicate ExcelData Validation

Đây là chức năng quen thuộc để thiết lập điều kiện cho một giá trị nhập vào một ô. Người dùng sẽ có thể thiết lập các điều kiện phù hợp với từng kiểu dữ liệu tương ứng: text, number, date hoặc thậm chí là một công thức (formula). Ngoài việc thiết lập điều kiện phục vụ cho việc nhập dữ liệu, chúng ta có thể sử dụng Data Validation để kiểm tra xem các dữ liệu đã được nhập trước đó có thỏa mãn điều kiện hay không và Excel sẽ tự động khoanh tròn các giá trị không thỏa mãn điều kiện.

Các bước cần thực hiện để sử dụng chức năng đánh dấu các giá trị không thỏa mãn điều kiện:

  • Bước 1: Bôi đen để lựa chọn vùng cần kiểm tra.
  • Bước 2: Chọn tab Data, đi đến chức năng Data Validation, rồi thiết lập các điều kiện vào vùng đang được lựa chọn.
  • Bước 3: Lựa chọn chức năng Circle Invalidata ngay phía dưới nút Data Validation để đánh dấu các giá trị không thỏa mãn.

*Lưu ý: Giới hạn của Data Validation là chỉ đánh dấu được 255 ô dữ liệu không thỏa mãn điều kiện, nếu vùng dữ liệu của chúng ta có nhiều hơn 255 lỗi thì sẽ cần thực hiện nhiều lần.

Flash Fill

Đây là chức năng chỉ có trên Excel phiên bản 2013 trở về sau. Flash Fill giúp điền dữ liệu tự động dựa vào các ví dụ mà người dùng đã điền vào trước đó.

Ví dụ: muốn tách First Name từ Employee Name, người dùng chỉ cần gõ giá trị muốn lấy ở dòng đầu tiên trong cột First Name. Đến dòng thứ 2, sau khi gõ chữ cái đầu của First Name tương ứng, Excel sẽ gợi ý kết quả và chỉ cần nhấn phím Enter, chúng ta có thể nhanh chóng điền kết quả mong muốn:
Flash Fill Excel

Tác giả: Nguyễn Lan Phượng

Related posts

0 0 votes
Article Rating
Subscribe
Notify of
guest

0 Comments
Inline Feedbacks
View all comments