DIKW, dữ liệu

Hãy chọn chart đúng (Phần 3)

Hai phần trước bài viết đã chia sẻ về 2 cách tiếp cận cho một bạn không phải là data scientist (DS) hay data analyst (DA).

Làm sao để lựa chọn đồ thị đúng, lựa chọn các biến danh mục, đo lường đúng. Để từ đó phục vụ và thể hiện tốt nhất ý nghĩa cho mỗi loại báo cáo khác nhau.

  • 4 cách thức cơ bản để trực quan hóa dữ liệu
  • Tips cho một số loại đồ thị, biểu đồ phổ biến và những cú lừa từ trực quan hóa dữ liệu

Bên cạnh đó, những chia sẻ này cũng giúp bạn có thêm kiến thức để đọc hiểu đồ thị, biểu đồ nhanh hơn. Là một phần trong việc xác định insights, vấn đề từ các loại báo cáo nhận được.

Hãy chọn chart đúng (Phần 1)

Hãy chọn chart đúng (Phần 2)

Tiếp theo mình sẽ chia sẻ cách tiếp cận thứ 3. Đây sẽ là cách tiếp cận từ góc nhìn một nhà quản lý, chủ doanh nghiệp.

Tại sao quan trọng?

“Understanding the big general picture first will set the stage for success in this journey”

Big data là một trong những xu hướng nổi cộm ở cả lĩnh vực công nghệ và kinh doanh.

Bây giờ bạn và doanh nghiệp bạn, hiển nhiên rồi, đang muốn dấn thân vào cuộc chơi data-driven.

Dù sao thì giờ Data đang dần trở thành một nền kiến thức căn bản để giúp bạn hiểu thế giới xung quanh.

Vì vậy, bạn nên bắt đầu nghĩ về nó như một vấn đề ngay bây giờ, kể cả khi bạn chưa có ý định chuyển đổi liền.

Hãy nghĩ về cách thức nào sẽ giúp bạn tiếp cận và giải quyết chúng đầu tiên nhé!

Bài viết này sẽ chia sẻ một phương pháp nền tảng – mô hình –  giúp bạn làm quen với việc tiếp cận và giải quyết vấn đề dựa trên Data.

Hay nói ngắn gọn là “Tư duy giải quyết vấn đề bằng Data”

Kim tự tháp DIKW

Để làm quen với việc phân tích dữ liệu. Giới thiệu bạn mô hình kim tự tháp DIKW.

DIKW, dữ liệu

Hãy hiểu nhanh về khái niệm này qua câu nói sau nhé. “Typically information is defined in terms of data, knowledge in terms of information, and wisdom in terms of knowledge”.

Thông tin sẽ được định nghĩa bằng dữ liệu.

Kiến thức sẽ được định nghĩa bằng thông tin.

Trí tuệ sẽ được định nghĩa bằng kiến thức.

Cấu trúc kim tự tháp DIKW

Mô hình kim tự tháp DIKW là một hệ thống phân cấp giữa dữ liệu, thông tin, kiến thức và trí tuệ.

Kim tự tháp DIKW xác định mối quan hệ chức năng có mục đích giữa các thành phần của chúng.

Trong đó các cấp thấp hơn được coi như là vật liệu xây dựng cho các cấp cao hơn.

Nếu đi lên trong hệ thống phân cấp, đòi hỏi lý luận tổng hợp như tích hợp và tổng hợp các khối vật liệu, xây dựng thành các khung mẫu chung và có tổ chức.

Nếu đi xuống trong hệ thống phân cấp thì liên quan đến lý luận phân tích, trong đó các khái niệm tổng quát được chia thành các phần cấu thành của chúng.

Mô hình kim tự tháp DIKW được dùng để xác định cấu trúc cơ bản cho thông tin và kiến ​​thức.

DIKW, dữ liệu

Tóm lại, mỗi bước đi lên kim tự tháp sẽ giúp trả lời các câu hỏi về dữ liệu ban đầu nhận được và còn gắn thêm giá trị cho dữ liệu.

Nói cách khác, càng làm phong phú dữ liệu data bằng ý nghĩa và bối cảnh, càng có nhiều thông tin,  kiến ​​thức và hiểu biết sâu sắc hơn về nó.

Ở trên đỉnh của kim tự tháp, khi đã biến kiến ​​thức và hiểu biết sâu sắc thành một trải nghiệm, kinh nghiệm. Điều này sẽ giúp dự đoán và dẫn dắt những hành động trong hiện tại, tương lai.

Tiếp theo, cùng tìm hiểu kỹ hơn mỗi phân cấp của kim tự tháp nhé!

Data – dữ liệu

DIKW, dữ liệu

Dữ liệu là một tập hợp các tín hiệu, biểu tượng, sự thật, dấu hiệu, tính chất, con số,… những thứ vụn vặt, thô sơ không có cấu trúc và tổ chức cũng chưa được xử lý qua.

Trong lĩnh vực CNTT, nó có thể là nhật ký máy chủ, sự kiện, hành vi người dùng hoặc bất kỳ tập dữ liệu dataset nào.

Nó trơ.

Và nếu chúng ta không biết ý nghĩa hay bối cảnh của nó. Nó vô dụng.

Ví dụ,

khi bạn nhìn vào con số này 12012012. Đây là dãy các con số nối tiếp với nhau.

Tiếp theo. Bạn nhận được ý nghĩa của dãy số là “this is a date”.

Ta da! Bạn đọc ra thông tin nhận được từ dãy số rồi.

Ngày 12 tháng 1 năm 2012

Information – thông tin

DIKW, dữ liệu

Bạn nhận được Thông tin khi bạn bắt đầu làm cho dữ liệu trở nên hữu ích.

Thông tin tạo nên bối cảnh, ý nghĩa cho dữ liệu.

Đó là khi Data được “làm sạch” các lỗi, được xử lý thêm vài bước theo cách giúp dễ dàng đo lường, trực quan hóa và phân tích cho một mục đích. 

Cụ thể, tùy vào mục đích sử dụng, sẽ có các tổ hợp các bước làm sạch dữ liệu như xử lý, tổ chức, hệ thống, phân loại, tổng hợp, đánh giá,…. Để cuối cùng, bạn nhận được Thông tin hữu ích từ Dữ liệu rác ban đầu.

Ở bước này, các câu hỏi “Cái gì”, “Khi nào”, “Ở đâu” và “Ai” sẽ được trả lời, để làm rõ ý nghĩa thông tin của Dữ liệu.

Tóm lại, Thông tin là Dữ liệu có ý nghĩa.

“Ý nghĩa” này có thể hữu ích, nhưng không phải lúc nào cũng hữu ích thật sự.

Knowledge – kiến thức

DIKW, dữ liệu

Là bước tiếp theo trong kim tự tháp, và có lẽ là bước nhảy vọt quan trọng nhất.

Nó ngầm đòi hỏi cần có sự “học hỏi sâu”.

Sau khi lấy dữ liệu, phân loại và xử lý nó tạo nên Thông tin. Tiếp theo để có được Kiến thức, cần sắp xếp tất cả Thông tin này theo cách có thể hữu ích cho mục đích cụ thể.

Nghĩa là, câu hỏi “bằng cách nào” mà những Thông tin, nhận được từ dữ liệu sau làm sạch, có liên quan đến mục đích sử dụng được trả lời.

“How” are the pieces of this information connected to other pieces to add more meaning and value? And, maybe most importantly, “how” can we apply the information to achieve our goal?

Tóm lại, trong khi Thông tin có thể giúp bạn hiểu các mối quan hệ, Kiến thức cho phép bạn phát hiện các mẫu, bộ khung chung (pattern).

Một định nghĩa khác rất hay là “Kiến thức là một cấu trúc tinh thần, được tạo ra từ việc học tích lũy và phân tích Thông tin có hệ thống”

Đây là nền tảng sẽ cho phép bạn xây dựng các mô hình dự đoán,  phát hiện ra các insight, giá trị hiểu biết sâu từ đó đưa ra các quyết định tiếp theo.

Wisdom – trí tuệ (Action)

DIKW, dữ liệu

Trí tuệ là đỉnh cao nhất và là phân cấp cuối cùng.

Nó cho phép bạn dự đoán tương lai một cách chính xác, không chỉ bằng cách phát hiện insight và hiểu các khung mẫu chung, mà là bước hiểu sâu sắc “Tại sao” đằng sau các mẫu, khung chung đó hình thành.

Có thể nói rằng, nếu Dữ liệu và Thông tin giống như nhìn lại quá khứ, Kiến ​​thức và Trí tuệ gắn liền với những gì bạn làm bây giờ và những gì bạn muốn đạt được trong tương lai.

Trí tuệ là tất cả về tương lai: nó dựa vào Kiến thức và mô hình chung (pattern). Từ đó giúp bạn xây dựng các mô hình dự đoán, mang lại lợi thế cạnh tranh theo cấp số nhân.

Nếu Kiến thức già đi và lỗi thời nhanh chóng vì thực tế thay đổi nhanh và liên tục. Thì Trí tuệ vẫn khó phá vỡ hơn (nó là nguyên tắc hay quy luật bất biến).

Dưới góc độ phát triển của con người:

Trí tuệ là khả năng sử dụng kiến ​​thức để đưa ra những đánh giá chính xác, đáp ứng với một bối cảnh cụ thể, mà không cần sự trợ giúp thêm của các sự kiện chưa phát hiện.

Trí tuệ là biết “tại sao” mọi thứ lại vận hành như vậy, vì nó nhìn thấy toàn bộ tổng thể của bức tranh.

Trí tuệ liên quan đến việc biết những điều đúng đắn để làm, vì lợi ích lớn hơn. Nó đòi hỏi một ý thức về những gì là đúng và sai, đạo đức và phi đạo đức. Nó là con người duy nhất.

Đúng, đây là một kỹ năng thuần túy của con người.

Tuy nhiên, AI đang bắt kịp rất nhanh.  Khi Trí tuệ AI trở nên giỏi hơn trí tuệ của con người, kết quả sẽ không thể đoán trước.

Góc nhìn khác

Tiếp theo, hình ảnh sau đây minh họa mô hình kim tự tháp DIKW dưới những góc nhìn đa chiều khác.

Nếu bạn là nhà tâm lý học, nghiên cứu về não bộ con người hãy nhìn dưới góc độ sự phát triển và hình thành liên kết của nơron.

Nếu bạn là nhà lập trình, kỹ sư máy tính hãy nhìn dưới góc độ xây dựng một hệ thống vận hành bằng công nghệ từ dữ liệu.

DIKW, dữ liệu

Một số ví dụ

Ví dụ 1: đèn giao thông

DIKW, dữ liệu

Ví dụ 2 các dòng hải lưu ngoài đại dương

DIKW, dữ liệu

Ví dụ 3: Dự đoán thời tiết

Dữ liệu: Trời mưa 

Thông tin: Nhiệt độ giảm 5 độ, độ ẩm tăng 5% trong một giờ và sau đó trời bắt đầu mưa lúc 3 giờ chiều.  

Kiến thức: Sự gia tăng nhanh chóng độ ẩm, kèm theo sự giảm nhiệt độ gây ra bởi các khu vực áp suất thấp hơn, sẽ có khả năng làm cho bầu không khí không thể giữ được độ ẩm và mưa.  

Trí tuệ: Dựa trên mô hình quan sát và toán học, chúng ta có thể dự đoán tại sao và khi nào trời sẽ mưa trong tương lai, và chúng ta có thể làm điều đó nhanh và có hệ thống đến mức nó sẽ không cần nhiều phân tích. Vì bạn đã có sự hiểu biết về tất cả các tương tác xảy ra giữa sự bốc hơi, dòng không khí, độ dốc nhiệt độ, thay đổi và mưa.

Kết luận

Bạn có thể nhận ra đây không phải là mô hình chuyên môn dành cho khoa học dữ liệu mà là mô hình phát triển chung của não bộ, khả năng, nhận thức của con người.

Tuy nhiên, mô hình này đã trở thành một mẫu chung, quy luật không đổi để bạn có thể áp dụng vào việc xử lý Data.

Nguồn:

https://www.ontotext.com/knowledgehub/fundamentals/dikw-pyramid/

https://towardsdatascience.com/rootstrap-dikw-model-32cef9ae6dfb