Big Data: Mô hình “5Vs” và cách triển khai hiệu quả

Theo báo cáo Top 10 xu hướng công nghệ của Gartner 2012 thì Big Data là một trong những công nghệ quan trọng nhất. Có rất nhiều điều thú vị về Big Data và cũng có nhiều sự nhầm lẫn về nó.

 

Trên thế giới có nhiều định nghĩa về Big Data. Vào năm 2001, nhà phân tích Doug Laney của hãng META Group (bây giờ chính là công ty nghiên cứu Gartner) đã nói rằng những thách thức và cơ hội nằm trong việc tăng trưởng dữ liệu có thể được mô tả bằng ba chiều "3V": tăng về số lượng lưu trữ (volume), tăng về tốc độ xử lý (velocity) và tăng về chủng loại (variety). Giờ đây, Gartner cùng với nhiều công ty và tổ chức khác trong lĩnh vực công nghệ thông tin tiếp tục sử dụng mô hình "3V" này để định nghĩa nên Big Data. Đến năm 2012, Gartner bổ sung thêm rằng Big Data ngoài ba tính chất trên thì còn phải "cần đến các dạng xử lí mới để giúp đỡ việc đưa ra quyết định, khám phá sâu vào sự vật/sự việc và tối ưu hóa các quy trình làm việc".


big-data-analyticsMô hình "5Vs" – năm tính chất của Big Data

Sau đây là khái niệm mới về Big Data 2014 của Gartner về mô hình "5Vs" – năm tính chất quan trọng nói lên Big Data:

Volume (Số lượng lưu trữ)

Big Data ("dữ liệu lớn") là tập hợp dữ liệu có dung lượng lưu trữ vượt mức đảm đương của những ứng dụng và công cụ truyền thống. Kích cỡ của Big Data đang từng ngày tăng lên, và tính đến năm 2012 thì nó có thể nằm trong khoảng vài chục terabyte cho đến nhiều petabyte (1 petabyte = 1024 terabyte) chỉ cho một tập hợp dữ liệu mà thôi.

Velocity (Tốc độ xử lý)

Dung lượng gia tăng của dữ liệu rất nhanh và tốc độ xử lý đang tiến tới real-time. Các ứng dụng phổ biến trên lĩnh vực Internet, Tài chính, Ngân hàng, Hàng không, Quân sự, Y tế – Sức khỏe ngày hôm nay phần lớn dữ liệu lớn đc xử lý real-time. Công nghệ xử lý dữ liệu lớn ngày một tiên tiến cho phép chúng ta xử lý tức thì trước khi chúng được lưu trữ vào cơ sở dữ liệu.

Variety (Đa dạng chủng loại)

Hình thức lưu trữ và chủng loại dữ liệu ngày một đa dạng hơn. Trước đây chúng ta hay nói đến dữ liệu có cấu trúc thì ngày nay hơn 80% dữ liệu trên thế giới được sinh ra là phi cấu trúc (tài liệu, blog, hình ảnh, video, voice v.v.). Công nghệ Big Data cho phép chúng ta ngày nay liên kết và phân tích đa dạng chủng loại dữ liệu với nhau như comments/post của một nhóm người dùng nào đó trên Facebook với thông tin video được chia sẻ từ Youtube và Twitter.

Veracity (Độ chính xác)

Một trong những tính chất phức tạp nhất của BigData là độ chính xác của dữ liệu. Với xu hướng Social Media và Social Network ngày nay và sự gia tăng mạnh mẽ tính tương tác và chia sẻ của người dùng Mobile làm cho bức tranh xác định về độ tin cậy & chính xác của dữ liệu ngày một khó khăn hơn. Bài toán phân tích và loại bỏ dữ liệu thiếu chính xác và nhiễu đang là tính chất quan trọng của BigData.

Value (Giá trị thông tin)

Giá trị thông tin là tính chất quan trọng nhất của xu hướng công nghệ Big Data. Ở đây doanh nghiệp phải hoạch định được những giá trị thông tin hữu ích của BigData cho vấn đề, bài toán hoặc mô hình hoạt động kinh doanh của mình. Có thể nói việc đầu tiên là phải xác định được tính chất "Value" thì mới nên bắt tay vào BigData.

Việt Nam đang ngày càng gia tăng tốc độ phát triển và hội nhập với các xu hướng công nghệ thế giới. Với hơn 30 triệu người dùng Internet và hơn 15 triệu ngươi dùng Mobile Internet làm cho Việt Nam đang đứng trước một cơ hộ vô cùng lớn về khai thác dữ liệu lớn. Sẽ có những doanh nghiệp Việt Nam khai thác thành công dữ liệu lớn với doanh số hàng trăm triệu USD trong vòng 5 năm tới. Đặc biệt, giai đoạn 2014-2016, xu hướng Mobile và lượng người dùng Internet 3G sẽ tiếp tục tăng mạnh. Các dịch vụ kết nối OTT (Over-the-top) và truyền thông xã hội đóng góp hơn 80% phương thức giao tiếp online, video online và nội dung số mobile. Điều này góp phần đẩy mạnh xu hướng truyền thông số đa phương tiện, đa màn hình (PC, smartphone , tablet, smart TV) sẽ bùng nổ với độ phủ hơn 50% dân số Việt Nam. Việt Nam là một kho "vàng" dữ liệu vô cùng lớn cho việc ứng dụng Big Data.

Triển khai dữ liệu lớn bắt đầu từ đâu?

Dựa trên mô hình "5Vs" doanh nghiệp có thể xác định các yếu tố dữ liệu của mình xem có liên quan tới Big Data không? Điều quan trọng nhất để triển khai hiệu quả Big Data thì doanh nghiệp cần xác định được tính chất "Value" trong mô hình "5Vs". Để làm rõ hơn nhu cầu và tính khả thi của việc triển khai Big Data trong doanh nghiệp của mình bạn cần trả lời cho 3 câu hỏi sau:

1. Vấn đề doanh nghiệp đang gặp là gì?

Doanh nghiệp cần xác định rất rõ vấn đề hoặc bài toán trong kinh doanh mà cần giải quyết hoặc tối ưu. Ví dụ: bạn là một cty bán lẻ, phân phối hay eCommerce cần gia tăng số lượng đơn hàng/tháng.

2. Bạn có gặp nhiều vấn đề liên quan tới dữ liệu ko?

Trong vận hành kinh doanh bạn có gặp các vấn đề liên quan tới dữ liệu không? Hoặc nói cách khác là trong quy trình hệ thống bán hàng của bạn có tận dụng nhiều dữ liệu ko? Bạn cần làm rõ các tính chất "5Vs" Big Data trong hoạt động kinh doanh của mình. Ví dụ: Một trang web bán hàng online thì hầu hết dữ liệu hoạt động của dịch vụ và thông tin khách hàng đều được lưu trữ lại, bài toán marketing cho eCommerce có liên quan tới rất nhiều dữ liệu khách hàng và thị trường (Online/Offline).

3. Phân tích dữ liệu lớn có giúp bạn giải quyết vấn đề đó không?

Thường thì để trả lời cho câu hỏi này bạn cần một nhóm chuyên gia BigData cho lĩnh vực hoạt động kinh doanh của bạn. Vấn đề được đặt ra là phải trả lời và hoạch định rõ tính chất "Value" Big Data đối với vấn đề hoặc bài toán bạn quan tâm. Đây cũng là chữ "V" quan trọng nhất trong mô hình "5Vs". Hãy đừng vội vàng triển khai Big Data trong doanh nghiệp nếu bạn chưa có câu trả lời cho câu hỏi này. Ví dụ: Amazon là một web Commerce đã đặt ra mục tiêu thay vì "Làm sao để bán hàng?" thì họ xác định luôn là "Làm sao để bán mặt hàng tiếp theo?". Và với mô hình kinh doanh Online/Offline này Amazon đã tận dụng Big Data rất hiệu qua cho việc tối ưu hóa các quy trình vận hành từ tự động cho đến bán tự động. Hệ thống website, affiliate, marketing và CRM của cty hoạt động trên Big Data để thấu hiểu nhu cầu khách hàng khi mua sắm trên Amazon. Hệ thống Recommendation của Amazon được xem là một trong những hệ thống khuyến nghị người dùng mua sắm tốt nhất thế giới với lợi thế vượt trội hơn Google. Facebook ở dữ liệu mua bán của người tiêu dùng.

Đinh Lê Đạt – CTO FPT Online

Theo Twenty