[Ecommerce Analytics] Chương 3: Phương pháp và kỹ thuật phân tích thương mại điện tử

phan-tich-thuong-mai-dien-tu

Bạn đọc có thể tìm hiểu chương 2 trước khi bắt đầu chương 3: Chuỗi giá trị phân tích thương mại điện tử

Chương này đề cập đến một số khái niệm hữu ích cho việc phân tích dữ liệu thương mại điện tử. Đây là phần chuyên sâu dành cho người đọc đã biết các khái niệm cơ bản về phân tích, chẳng hạn như mô hình hóa dữ liệu, các phương pháp toán học và thống kê. Nó được viết cho các nhà phân tích và những người có “thiên hướng” phân tích, muốn tìm hiểu thêm về cách phân tích dữ liệu. Nhà phân tích nên tạo ra và công bố các phân tích hữu ích có giá trị giúp doanh nghiệp đưa ra quyết định tốt hơn. Chương này thảo luận một số phương pháp để làm điều đó, chẳng hạn như:

• Tổng quan về các lý thuyết học thuật xưa và nay về phân tích

• Các kỹ thuật kiểm tra và thẩm vấn dữ liệu sau khi được trích xuất từ nguồn

• Cách mô hình hóa dữ liệu thương mại điện tử

• Cách khai thác dữ liệu thống kê và kỹ thuật “máy tính tự học” (machine learning) để phân tích dữ liệu

1. Lịch (calendar) trong phân tích thương mại điện tử

Phân tích thương mại điện tử thường liên quan đến việc so sánh dữ liệu qua các khoảng thời gian khác nhau. Các bên liên quan muốn biết doanh số và tỷ suất lợi nhuận so với tuần trước, tháng trước, năm trước, v.v. Ngày này so với ngày kia (DoD), tuần này so với tuần khác (WoW), tháng này so với tháng khác (MoM), quý này so với quý kia (QoQ) và năm này so với năm nọ (YoY) là những so sánh thường gặp. Các khoản thời gian theo mùa và tác động mang tính thời vụ cần thiết được theo dõi và đo lường khi phân tích thương mại điện tử. Thật không may, việc so sánh các khoảng thời gian trong thương mại điện tử không đơn giản. Các ngày có số thứ tự tương tự không trùng với ngày trong tuần.

Calender for Retailer

Ví dụ: ngày 4 tháng 7 năm 2016 là thứ Hai, nhưng ngày 4 tháng 7 năm 2015 là thứ Bảy. Ngày lễ Tạ ơn có thể luôn là ngày thứ năm thứ tư trong tháng mười một, nhưng nó không thường rơi vào cùng một ngày nếu tính theo thứ tự ngày trong tháng. Liên đoàn bán lẻ quốc gia của Mỹ (NRF) nhận ra rằng việc so sánh dữ liệu có thể gặp khó khăn và đã phát minh ra lịch bán lẻ. Lịch NRF loại bỏ vấn đề nói trên vì nó chuẩn hóa cách tính tuần và do đó chuẩn hóa cách so sánh. Nó được gọi là lịch 4-5-4. Đối với phân tích thương mại điện tử, việc áp dụng lịch 4-5-4 của Liên đoàn bán lẻ quốc gia là một thông lệ, mặc dù việc này là hoàn toàn tự nguyện. Lịch 4-5-4 đặc biệt hữu ích cho các công ty vận hành cả việc kinh doanh bán lẻ truyền thống ngoại tuyến (offline) và trực tuyến (online).

Lịch 4-5-4 chia năm thành các tháng dựa trên tuần tự tháng 4 tuần, tháng 5 tuần, rồi lại tháng 4 tuần. Lịch NRF sắp xếp các ngày lễ theo cách có thể so sánh được theo thời gian. Lịch này cũng đảm bảo số ngày cuối tuần như nhau trong mỗi tháng. Theo cách này, thời gian có thể được so sánh chính xác. Biến động và thay đổi trong dữ liệu không thể bị diễn giải sai hoặc hiểu nhầm do nhầm lẫn ngày. Lịch này cũng tính đến các thay đổi do năm nhuận và hiện tượng “tuần thứ 53” xảy ra vào năm 2017.

2. Kể chuyện rất quan trọng đối với phân tích thương mại điện tử

Việc phân tích không chỉ liên quan đến công nghệ, dữ liệu, báo cáo, bảng điều khiển và phương pháp được áp dụng. Các phân tích, bất kể thuộc loại gì, cần được hiểu chính xác và đầy đủ bởi các bên liên quan. Giao tiếp tạo ra sự thấu hiểu, và cách kể chuyện tạo ra sự thấu hiểu trong giao tiếp. Trong thực tế, việc kể một câu chuyện hấp dẫn cho các bên liên quan về những gì dữ liệu cho biết hoặc được sử dụng để làm gì là một trong những bước phân tích cuối cùng. Sử dụng các câu chuyện để truyền đạt câu trả lời cho vấn đề của doanh nghiệp. Hãy nhớ rằng các phương pháp và kỹ thuật được áp dụng thảo luận trong chương này có thể thú vị đối với các nhà phân tích, nhưng các doanh nhân có thể không quen với với các khái niệm mới, không quen thuộc hoặc khó.

Sau đây là một số hướng dẫn giúp kể chuyện. Cân nhắc áp dụng các kỹ thuật này khi truyền đạt kết quả phân tích dưới dạng kể chuyện:

• Xác định lý do tại sao phải phân tích và tại sao câu chuyện bạn sắp kể là quan trọng: Các doanh nhân vô cùng bận rộn, hãy giải thích tại sao họ nên quan tâm.

• Chỉ ra thách thức mà bạn muốn thảo luận và chi phí phải trả nếu không khắc phục

• Đưa ra các cảnh báo: nếu có bất kỳ lỗi, thiếu sót, chú ý hoặc những điều cần thảo luận, hãy chỉ rõ từ trước.

• Cá nhân hóa việc phân tích bằng cách sử dụng các nhân vật hư cấu để giúp nhân cách hóa dữ liệu bạn đang báo cáo: Sử dụng các nhân vật hư cấu giúp việc phân tích được cá nhân hóa và giảm rủi ro liên quan đến chính trị, loại bỏ nguy cơ xúc phạm một bên liên quan hoặc một nhóm cụ thể.

• Trích dẫn các sự kiện quan trọng giúp minh họa cho câu chuyện: Chú ý các tác động bên ngoài và những điều xảy ra trong doanh nghiệp khi dữ liệu được thu thập hoặc khi xảy ra hành vi có thể giúp làm rõ phân tích.

• Sử dụng hình ảnh: Hình ảnh đáng giá hơn ngàn lời nói, giúp bạn tiết kiệm thời gian giải thích khái niệm bằng văn bản. Bạn có thể sử dụng biểu đồ, đồ thị, đường xu hướng và các kỹ thuật trực quan hóa dữ liệu khác…

• Hạn chế sử dụng từ vựng quá phức tạp. Các từ vựng bí truyền ít người hiểu và thuật ngữ khoa học tốt nhất chỉ nên sử dụng trong nội bộ nhóm phân tích. Hãy cố gắng làm cho việc giao tiếp và trình bày phân tích đơn giản nhất có thể.

• Xác định yêu cầu: chỉ ra rõ ràng những gì bạn nghĩ cần phải được thực hiện bằng văn bản, sử dụng các động từ hướng tới hành động và danh từ mô tả. Đề cập đến những gì bạn nghĩ và những gì bạn muốn làm.

• Xác định tổn thất nếu không hành động: Chỉ rõ tác động tài chính của việc không làm gì và so sánh với chi phí thực hiện. 

• Kết luận bằng một loạt các khuyến nghị liên quan đến việc tạo ra giá trị (giảm chi phí hoặc tăng doanh thu). Mặc dù có thể không phải là chuyên gia cùng cấp với người yêu cầu phân tích, các nhà phân tích nên bày tỏ ý tưởng và quan điểm của họ về dữ liệu và tình hình kinh doanh. Các khuyến nghị nên được đưa ra rõ ràng và trực tiếp dựa trên phân tích dữ liệu của Google và các khuyến nghị này phải được giám sát và thẩm vấn.

Khái niệm “phân tích khám phá dữ liệu” (viết tắt tiếng Anh là EDA) của Tukey là một khái niệm quan trọng trong phân tích thương mại điện tử

John Tukey là tác giả của cuốn sách nổi tiếng “Phân tích khám phá dữ liệu” (Exploratory Data Analysis) xuất bản năm 1977. 

Sách Phân tích dữ liệu khám phá

Lý do Tukey được nhắc đến trong cuốn sách này không chỉ là vì ông ấy có ảnh hưởng lớn trong việc sử dụng toán học và thống kê để hiểu dữ liệu, mà còn bởi vì mô hình phân tích dữ liệu của ông ta dựa trên một tập hợp các triết lý hoặc nguyên lý liên quan đến mô hình hóa dữ liệu , phân tích mẫu, hiểu ngữ cảnh, đưa ra giả thuyết hay chỉ đơn giản là xem xét dữ liệu. Tukey khuyến nghị :

• Kiểm tra dữ liệu trực quan để hiểu các mẫu và xu hướng: Dữ liệu thô cần được kiểm tra để tìm hiểu các xu hướng và mẫu, từ đó quyết định nên dùng phương pháp phân tích nào.

• Sử dụng các phương pháp tốt nhất có thể để hiểu sâu hơn không chỉ về dữ liệu, mà cả việc dữ liệu nói lên điều gì 

• Xác định các biến và mô hình dữ liệu: Trong phân tích thương mại điện tử có rất nhiều dữ liệu, nhưng làm thế nào để bạn biết đâu là dữ liệu phù hợp? EDA giúp xác định những dữ liệu quan trọng.

• Phát hiện dữ liệu ngoại lệ: Dữ liệu kỹ thuật số có thể có ngoại lệ và các trường hợp bất thường, các bất thường này có thể có vai trò quan trọng nhưng cũng có thể chỉ là ngẫu nhiên.

• Kiểm tra giả thuyết và giả định: Ý tưởng sử dụng các thông tin chi tiết có được từ dữ liệu để thực hiện các thay đổi trong trải nghiệm kỹ thuật số là rất quan trọng trong phương pháp EDA.

• Áp dụng và điều chỉnh mô hình tốt nhất có thể để phù hợp với dữ liệu 

Nguyên tắc của Tukey giúp đơn giản hóa việc tạo phân tích vì trước tiên nó nhấn mạnh vào việc khám phá trực quan dữ liệu thay vì áp dụng ngay phương pháp thống kê vào dữ liệu.

Triết lý của EDA phù hợp với phân tích thương mại điện tử. Một trong những điều đầu tiên mà nhà phân tích có thể làm khi kiểm tra tập dữ liệu là xác định thứ nguyên và chỉ số chính và sử dụng phần mềm phân tích để trực quan hóa dữ liệu trước khi áp dụng bất kỳ phương pháp thống kê nào. Bằng cách này, nhà phân tích có thể sử dụng các khả năng nhận dạng mẫu để quan sát mối quan hệ giữa các dữ liệu và các dữ liệu bất thường để tập trung vào công việc của mình.

Sau đó, sau khi xem xét dữ liệu, xác định cách phân tích dữ liệu, rồi áp dụng mô hình và phương pháp phân tích phù hợp. Cách tiếp cận của Tukey về EDA để phân tích dữ liệu có thể được sử dụng riêng hoặc cùng với các kỹ thuật phân tích khác. EDA có thể được sử dụng kết hợp với các phương thức khác như phương pháp thống kê cổ điển và phương pháp Bayes. May mắn thay, cả ba phương thức phân tích dữ liệu đều cung cấp khung để tìm hiểu sâu về dữ liệu và đều có thể áp dụng được cho phân tích thương mại điện tử. EDA, tuy nhiên, ít áp đặt hơn so với phương pháp cổ điển hoặc Bayes. Tính linh hoạt này tỏ ra rất hữu ích khi phân tích dữ liệu thương mại điện tử.

EDA chủ trương rằng bạn nên xem xét dữ liệu trước bằng cách trực quan hóa dữ liệu và sau đó phân tích dữ liệu bằng các kỹ thuật tốt nhất có thể, có thể là kỹ thuật cổ điển hoặc Bayes. Phương pháp thống kê cổ điển, không giống như EDA, trước tiên sẽ yêu cầu nhà phân tích điều chỉnh dữ liệu cho phù hợp với mô hình, có lẽ sẽ cắt bớt dữ liệu. Phương pháp Bayes là phương pháp mở rộng của phương pháp cổ điển, trong đó trước tiên bạn sẽ phải xem xét dữ liệu trước. EDA khuyên bạn nên tạo trực quan hóa dữ liệu trước khi chọn mô hình hoặc đi đến bất kỳ kết luận nào.

Kho template trực quan hóa dữ liệu

Các nhà phân tích cổ điển và Bayes có thể sẽ xem trực quan hóa dữ liệu như một vật phẩm hỗ trợ được tạo ra trong hoặc sau khi phân tích (không phải là bước đầu tiên để bắt đầu phân tích). EDA sẽ xem các kỹ thuật Gaussian và phi Gaussian có giá trị như nhau dựa trên dữ liệu và sẽ khuyến khích nhà phân tích khám phá dữ liệu và đưa ra kết luận đơn giản trước. Việc phân tích chuyên sâu trong phương pháp EDA được thực hiện sau khi các kết luận đơn giản được đưa ra.

Khi tiến hành phân tích kỹ thuật số, hãy nhớ đến 3 phương pháp: cổ điển, Bayes và EDA và ghi nhớ những gì Tukey nói. Sau đây là gợi ý ngắn về phân tích khám phá dữ liệu từ Tukey:

Đó là sự kết hợp giữa thái độ, sự linh hoạt và giấy vẽ biểu đồ (hoặc giấy trong suốt, hoặc cả hai).

Không có danh mục các kỹ thuật nào có thể thay thế cho sự sốt sắng tìm kiếm những gì có thể nhìn thấy, dù có dự đoán được hay không. Đó là linh hồn của việc phân tích thăm dò dữ liệu. Giấy vẽ biểu đồ và giấy trong suốt là có sẵn, tuy không phải là một kỹ thuật, nhưng việc kiểm tra bằng mắt là công cụ tìm kiếm tốt nhất mà bạn có trong số các công cụ bạn hoàn toàn không thể dự đoán được.

Cảm ơn chị Đỗ Vũ Lưu Phương đã tạo ra những bản dịch quý giá về tài liệu Ecommerce Analytics cho cộng đồng.

>> Mời bạn đọc tìm hiểu chương tiếp theo: Trực quan hóa, lập bảng điều khiển kỹ thuật số (dash board*) và báo cáo dữ liệu & phân tích thương mại điện tử

Những Bài Viết Liên Quan

Theo dõi A1 Blog

Nhận các bài viết mới về các lĩnh vực tại A1

Xem nhiều nhất