chọn biểu đồ, đồ thị

Hãy chọn chart đúng (Phần 2)

Xem Phần 1 tại đây

Doanh nghiệp chọn đầu tư nền tảng hoặc phần mềm để xử lý dữ liệu.

Tuy nhiên, ngay cả khi bạn đã học miệt mài để sử dụng công cụ thành thạo

Bạn vẫn gặp rắc rối với việc sử dụng công cụ để lựa chọn biểu đồ, đồ thị cho báo cáo kinh doanh, marketing của mình

Hoặc đơn giản, bạn chỉ biết nhìn biểu đồ và theo dõi nhưng vẫn chưa quen tìm kiếm insight trong mỗi loại biểu đồ

Đây sẽ là một bài viết hữu ích giúp cho bạn tránh được các rắc rối như sau

chọn biểu đồ, đồ thị

Hoặc như vậy

chọn biểu đồ, đồ thị


Hoặc thế này

chọn biểu đồ, đồ thị

Chà, 99% trong các báo cáo bạn cần cung cấp cho khách hàng hoặc sếp và doanh nghiệp. Những biểu đồ trên là thứ bạn sẽ không muốn trình bày nhất.

Nhưng bạn vẫn hiểu rõ, trực quan hóa dữ liệu bằng biểu đồ, đồ thị là con đường nhanh và hiệu quả nhất để liên kết với các dữ liệu bạn có.

“If we work with chart types that are not the right fit for the data, we won’t convince anybody”

Bạn không phải là Data Scientist hay Data Analyst

Trừ khi bạn là nhà thống kê hoặc nhà phân tích dữ liệu, rất có thể bạn sẽ thường xuyên sử dụng hai loại phân tích dữ liệu được sử dụng phổ biến nhất: 

  • So sánh
  • Tỉ trọng thành phần

Để xác định biểu đồ nào phù hợp nhất, trước tiên bạn phải trả lời một vài câu hỏi sau:

  • Bạn muốn hiển thị bao nhiêu biến trong một biểu đồ? Một, hai, ba, nhiều?
  • Có bao nhiêu mục (điểm dữ liệu) bạn sẽ hiển thị cho mỗi biến? Chỉ một vài hay nhiều?
  • Bạn sẽ hiển thị các giá trị trong một khoảng thời gian, hoặc giữa các nhóm?

Ví dụ, biểu đồ thanh (Bar chart) phù hợp nhất để so sánh, trong khi biểu đồ đường (Line chart) thể hiện xu hướng hiệu quả nhất. 

Biểu đồ phân tán (Scatter plot) thể hiện tốt nhất các mối quan hệ và phân phối, trong khi biểu đồ tròn (Pie chart) chỉ nên được sử dụng để thể hiện các tỉ trọng thành phần đơn giản và không bao giờ dùng để so sánh hoặc thể hiện phân phối.

Sơ đồ hướng dẫn lựa chọn biểu đồ trong hình trên sẽ là công cụ giúp bạn chọn được biểu đồ thích hợp hiệu quả và nhanh chóng.

Tuy nhiên để thể hiện tối ưu 1 loại biểu đồ khi đã chọn được loại biểu đồ phù hợp, chúng ta vẫn cần nắm được 1 số tips khác.

Tiếp theo bài viết sẽ chia sẻ 1 số tips để thể hiện một số loại biểu đồ, đồ thị hiệu quả.

Column chart – biểu đồ cột

Biểu đồ cột có lẽ là loại biểu đồ được sử dụng nhiều nhất.

Biểu đồ này được sử dụng tốt nhất để so sánh các giá trị khác nhau trong đó mỗi giá trị cụ thể là một danh mục quan trọng mà người đọc cần quan sát.

Với biểu đồ cột, bạn có thể so sánh các giá trị cho các danh mục khác nhau. Hoặc so sánh các thay đổi giá trị trong một khoảng thời gian.

chọn biểu đồ, đồ thị

Biểu đồ cột rất tuyệt khi chúng ta muốn theo dõi sự khác nhau hoặc phát triển của một hoặc hai biến theo thời gian.

Ví dụ: một trong những ứng dụng thường xuyên nhất của biểu đồ thanh trong các bài thuyết trình của công ty là cho thấy tổng doanh thu của một công ty đã phát triển như thế nào trong một khoảng thời gian nhất định.

Ví dụ, biểu đồ thanh có thể khá trực quan khi chúng ta so sánh sự phát triển của hai biến số theo thời gian

chọn biểu đồ, đồ thị

Hoặc theo danh mục.

chọn biểu đồ, đồ thị

Tips khi sử dụng biểu đồ cột

  • Sử dụng biểu đồ cột để so sánh nếu số lượng danh mục nhỏ – tối đa năm.
  • Nếu một trong các biến phân loại (dimension) của bạn là thời gian – bao gồm năm, quý, tháng, tuần, ngày hoặc giờ – bạn phải luôn đặt trên trục hoành.
  • Trong các biểu đồ, thời gian phải luôn luôn chạy từ trái sang phải, không bao giờ từ trên xuống dưới.
  • Đối với biểu đồ cột, trục số phải bắt đầu từ 0.
  • Trong thiết kế, xóa các dòng pattern hoặc đường viền, đóng khung. Chỉ sử dụng đường viền cho các điểm nổi bật.

Bar chart – biểu đồ thanh

Biểu đồ thanh về cơ bản là biểu đồ cột ngang.

Nếu bạn có tên danh mục dài, tốt nhất nên sử dụng biểu đồ thanh vì chúng cho nhiều không gian để mắt bạn so sánh dễ hơn.

chọn biểu đồ, đồ thị

Bạn cũng nên sử dụng biểu đồ thanh, thay vì biểu đồ cột, khi số lượng danh mục lớn hơn bảy (nhưng không quá mười lăm) hoặc để hiển thị một tập hợp có số âm.

chọn biểu đồ, đồ thị

Bạn nên sử dụng biểu đồ thanh khi cần biểu thị các biến danh nghĩa (nominal) hoặc danh mục và biểu đồ cột khi cần biểu thị các biến thứ bậc (ordinal) hoặc tuần tự (sequential).

Line chart – biểu đồ đường

Biểu đồ đường là một trong những loại biểu đồ được sử dụng thường xuyên nhất.

Biểu đồ này phù hợp nhất cho việc trực quan hóa dữ liệu theo xu hướng trong một khoảng thời gian, khi số lượng điểm dữ liệu nhiều (hơn 20) hoặc liên tục.

chọn biểu đồ, đồ thị

Với biểu đồ đường, sự nhấn mạnh là sự tiếp tục hoặc dòng chảy của các giá trị (xu hướng), nhưng vẫn có một số hỗ trợ cho so sánh giá trị đơn, sử dụng các dấu dữ liệu (chỉ có ít hơn 20 điểm dữ liệu.)

chọn biểu đồ, đồ thị

Biểu đồ đường cũng là một thay thế tốt cho biểu đồ cột khi kích cỡ thể hiện của biểu đồ nhỏ.

Xem thêm:

Vì sao chèn kí tự vào template report quan trọng?

Phân tích dữ liệu? Top 10 công cụ tốt nhất cho Nhà Phân tích Dữ liệu

chọn biểu đồ, đồ thị

Biểu đồ dòng thời gian là một biến thể của biểu đồ đường.

Rõ ràng, bất kỳ biểu đồ đường nào hiển thị giá trị trong một khoảng thời gian đều được coi là biểu đồ dòng thời gian.

Sự khác biệt duy nhất ở đây là về chức năng – hầu hết các biểu đồ dòng thời gian sẽ cho phép bạn phóng to và thu nhỏ, nén hay kéo dài trục thời gian để xem thêm chi tiết hoặc xu hướng chung.

Các ví dụ phổ biến nhất của biểu đồ dòng thời gian có thể là:

• Giá thị trường chứng khoán thay đổi theo thời gian

• Khách truy cập trang web mỗi ngày trong 30 ngày qua

• Số lượng bán hàng theo ngày trong quý trước

Biểu đồ khu vực về cơ bản là biểu đồ đường.B

Biểu đồ khu vực sẽ lấp đầy khu vực bên dưới dòng, vì vậy cách sử dụng tốt nhất cho loại biểu đồ này là để trình bày thay đổi giá trị tích lũy theo thời gian, như cổ phiếu vật phẩm, số lượng nhân viên hoặc tài khoản tiết kiệm.

Không sử dụng biểu đồ khu vực để trình bày các giá trị dao động, như thị trường chứng khoán hoặc giá cả thay đổi.

chọn biểu đồ, đồ thị

Tips khi sử dụng biểu đồ đường

  • Để trình bày dữ liệu liên tục trong một thang đo khoảng, các khoảng cần có kích thước bằng nhau.
  • Trục có thể không bắt đầu từ 0 nếu thông điệp dự định của biểu đồ là tốc độ thay đổi hoặc xu hướng chung, không phải là giá trị chính xác hoặc giá trị so sánh. Nhưng tốt nhất là bắt đầu trục với số 0 vì một số người có thể giải thích biểu đồ không chính xác.
  • Thời gian phải luôn luôn chạy từ trái sang phải.
  • Đừng bỏ qua các giá trị để đảm bảo tính chính xác và nhất quán của việc trình bày thông tin xu hướng, ví dụ: một số ngày nhất định có giá trị bằng không.
  • Tối giản trong trình bày biểu đồ (loại bỏ hiệu ứng, đường guideline…) để nhấn mạnh xu hướng, tốc độ thay đổi và để giảm sự phân tâm.
  • Sử dụng tỷ lệ khung hình phù hợp để hiển thị thông tin quan trọng và tránh các hiệu ứng dốc đáng kể. Để có nhận thức tốt nhất, hãy nhắm đến độ dốc 45 độ (https://eagereyes.org/basics/banking-45-degrees?)

Pie chart – biểu đồ bánh

Biểu đồ bánh là một biểu đồ tròn được chia thành các lát. Một lát lớn hơn là phần lớn hơn của tổng số lượng mà nó đại diện.

Thường biểu thị các con số theo tỷ lệ phần trăm, được sử dụng để trực quan hóa một phần cho toàn bộ mối quan hệ.

chọn biểu đồ, đồ thị

Biểu đồ Donut là một dạng của biệt đồ bánh

Tips khi sử dụng biểu đồ bánh

  • Đảm bảo rằng tổng số của tất cả các phân loại bằng 100 phần trăm.
  • Chỉ sử dụng biểu đồ hình tròn nếu bạn có ít hơn sáu danh mục, trừ khi có danh mục lớn hơn rất nhiều và rõ ràng bạn muốn tập trung vào.
  • Tốt nhất, chỉ nên có hai danh mục, như nam và nữ ghé thăm trang web của bạn hoặc chỉ một danh mục, như thị phần của công ty bạn, so với toàn bộ thị trường.
  • Không sử dụng biểu đồ hình tròn nếu các giá trị danh mục gần như giống hệt nhau hoặc hoàn toàn khác nhau.
  • Không sử dụng 3D hoặc thổi các hiệu ứng riêng biệt – chúng làm giảm sự hiểu biết và hiển thị tỷ lệ không chính xác.

Xem thêm:

3 mẫu dữ liệu bảng giúp truyền thông hiệu quả đến khách hàng

Scatter plot – biểu đồ phân tán

Biểu đồ phân tán là một loại biểu đồ thường được sử dụng trong các lĩnh vực thống kê và khoa học dữ liệu.

Nó bao gồm nhiều điểm dữ liệu được vẽ trên hai trục. Mỗi biến được mô tả trong một biểu đồ phân tán sẽ có nhiều quan sát.

Biểu đồ phân tán chủ yếu được sử dụng để phân tích tương quan và phân phối.

Dùng để xác định mối quan hệ giữa hai biến khác nhau có tương quan hay không.

chọn biểu đồ, đồ thị
chọn biểu đồ, đồ thị

Biểu đồ phân tán cũng có thể hiển thị phân phối dữ liệu hoặc xu hướng phân cụm và giúp bạn phát hiện ra sự bất thường hoặc các điểm dị biệt, ngoại lệ.

chọn biểu đồ, đồ thị

Biểu đồ này thường được dùng để xây dựng các mô hình dự đoán, thống kê ra quyết định trong doanh nghiệp. Ví dụ bạn sẽ cần kiểm tra tự động tương quan giữa các biến phụ thuộc và độc lập  trước khi xây dựng biểu đồ kiểm soát.

Tips khi sử dụng biểu đồ phân tán

  • Dùng để trình bày mối quan hệ giữa hai biến số (scatter) hoặc ba (buble).
  • Vẽ hai hoặc ba biến trên một mặt phẳng tọa độ x-y.
  • Biến trục hoành thành thang đo logarit, do đó hiển thị mối quan hệ giữa các phần tử được phân phối rộng rãi hơn.
  • Trình bày các mẫu trong các tập hợp dữ liệu lớn, xu hướng tuyến tính hoặc phi tuyến tính, tương quan, cụm hoặc dị biệt.
  • So sánh số lượng lớn các điểm dữ liệu mà không quan tâm đến thời gian. Càng nhiều dữ liệu bạn đưa vào biểu đồ phân tán, bạn càng có thể so sánh tốt hơn.
  • Trình bày các mối quan hệ, nhưng không có giá trị chính xác để so sánh.

Đừng bị lừa bởi tiểu xảo đồ thị sau:

Trực quan hóa dữ liệu là một trong những công cụ quan trọng nhất mà bạn dùng phân tích dữ liệu.

Nhưng nó có thể dễ gây hiểu lầm nếu như bạn không có kiến thức với việc sử dụng đồ thị. 

Tiếp theo, hãy cùng xem xét 3 trong số những cách phổ biến nhất trong đó trực quan hóa có thể gây hiểu nhầm cho bất kỳ ai.

(Trích lược từ bài viết của anh Kien Vu)

Gốc trục số không bắt đầu từ 0

Kỹ thuật này có thể làm cho sự khác biệt trong dữ liệu dường như lớn hơn nhiều so với thực tế.

Ví dụ, xem một đồ thị thực tế như sau về việc phóng đại mức doanh thu qua các năm

chọn biểu đồ, đồ thị

Cắt bỏ chuỗi thời gian

Mặc dù không khiến cho dữ liệu bị sai lệch, việc cắt bỏ chuỗi thời gian nếu được sử dụng có chủ đích có thể khiến cho người đọc không có cái nhìn về toàn bộ số liệu, từ đó gây ra những nhận xét sai lầm.

Ví dụ như trong báo cáo doanh thu

chọn biểu đồ, đồ thị

Trong phân tích cổ phiếu

chọn biểu đồ, đồ thị

Phóng đại khoảng giá trị

Thông thường khoảng giá trị của đồ thị sẽ được lựa chọn sao cho lớn hơn giá trị lớn nhất của số liệu một chút và gốc của trục số bắt đầu từ số 0.

Tuy nhiên, người thiết kế đồ thị sẽ phóng đại khoảng giá trị này khi muốn “làm phẳng” sự biến động của số liệu.

Ví dụ người làm đồ thị muốn “làm phẳng” dữ liệu để không thấy rõ sự biến động

chọn biểu đồ, đồ thị

Giá trị 100 lớn hơn rất nhiều so với giá trị lớn nhất của dữ liệu, hãy so sánh với 1 đồ thị biệu thị đúng nhất về sự biến động.

chọn biểu đồ, đồ thị

Sử dụng cột đôi

chọn biểu đồ, đồ thị

Trong thực tế, tiểu xảo này được sử dụng để thu hẹp khoảng cách giữa doanh thu và lợi nhuận. Hoặc cố tình gây hiểu lầm về mức độ biến động, chênh lệch của dữ liệu

Tổng kết – DO và DON’T khi lựa chọn biểu đồ, đồ thị

  • Trục thời gian:

Khi sử dụng thời gian trong biểu đồ, hãy đặt nó trên trục hoành. Thời gian nên chạy từ trái sang phải. Đừng bỏ qua các giá trị (khoảng thời gian), ngay cả khi giá trị bằng 0.

  • Giá trị tỷ lệ:

Các số trong biểu đồ (được hiển thị dưới dạng thanh, diện tích, bong bóng hoặc phần tử đo vật lý khác trong biểu đồ) phải tỷ lệ thuận với các đại lượng số được trình bày.

Xóa mọi thông tin, dòng, màu sắc và văn bản dư thừa khỏi biểu đồ.

Đừng thêm quá nhiều thông tin vào một biểu đồ.  Nếu cần, hãy phân chia dữ liệu trong hai biểu đồ, sử dụng tô sáng, đơn giản hóa màu sắc hoặc thay đổi loại biểu đồ.

  • Sắp xếp:

Đối với biểu đồ cột và thanh, và cả biểu đồ tròn, để cho phép so sánh dễ dàng hơn, hãy sắp xếp dữ liệu của bạn theo thứ tự tăng dần hoặc giảm dần theo giá trị, không theo thứ tự bảng chữ cái.

  • Nhãn:

Sử dụng nhãn trực tiếp trên dòng, cột, thanh, bánh, vv, bất cứ khi nào có thể, để tránh tra cứu gián tiếp.

  • Nguyên tắc lựa chọn Màu sắc:

Trong bất kỳ biểu đồ nào, không sử dụng nhiều hơn sáu màu.

Để so sánh cùng một giá trị ở các khoảng thời gian khác nhau, hãy sử dụng cùng một màu ở cường độ khác nhau (từ sáng đến tối).

Đối với các loại khác nhau, sử dụng màu sắc khác nhau. Các màu được sử dụng rộng rãi nhất là đen, trắng, đỏ, xanh lá cây, xanh dương và vàng.

Giữ cùng bảng màu hoặc kiểu cho tất cả các biểu đồ trong chuỗi và cùng trục và nhãn cho các biểu đồ tương tự để làm cho biểu đồ của bạn nhất quán và dễ so sánh.

Kiểm tra biểu đồ của bạn sẽ trông như thế nào khi được in ra theo thang độ xám. 

Nếu bạn không thể phân biệt sự khác biệt màu sắc, bạn nên thay đổi màu sắc và độ bão hòa của màu sắc.

7 đến 10 phần trăm nam giới bị gặp vấn đề thị giác nhận biết màu. Hãy ghi nhớ điều đó khi tạo biểu đồ, đảm bảo chúng có thể đọc được cho người mù màu. Hoặc, cố gắng sử dụng bảng màu thân thiện với người mù màu.

  • Điều chỉnh lạm phát:

Khi sử dụng các giá trị tiền tệ trong một chuỗi dài hạn, hãy đảm bảo điều chỉnh theo lạm phát.  (Tỷ lệ lạm phát của EU, tỷ lệ lạm phát của Mỹ)

Nguồn:

https://eazybi.com/blog/data_visualization_and_chart_types/

Xem thêm:

Xây dựng mọi Dashboard bằng A1 Analytics