Khi mới ra đời, Facebook cũng như nhiều mạng xã hội khác đã định nghĩa lại cách con người kết nối với nhau. Đến thời điểm hiện tại đã không chỉ có con người kết nối với nhau mà trên nền tảng internet, mọi vật dụng đã có thể liên kết với nhau (Internet of Things - IoT).

data_emci.jpg
Dữ liệu xuất hiện xung quanh con người và cho thấy rất nhiều điều về con người, trong khi bản thân con người lại không hiểu nhiều về dữ liệu.

Những kết nối đã và đang tạo ra một lượng dữ liệu khổng lồ, làm cho hệ sinh thái số thay đổi nhanh chóng. Tuy nhiên theo giới chuyên gia, 90% các dữ liệu đang sản xuất ra hiện nay là dữ liệu không có cấu trúc. Nguy hiểm hơn là một nửa trong số dữ liệu không có cấu trúc đó lại không được bảo vệ.

Ông Pierre Bonnet, nhà sáng lập Smart-up.org kiêm Giám đốc vận hành Orchestra Networks, một trong những công ty uy tín về quản trị dữ liệu, cho biết, với internet dữ liệu xuất hiện xung quanh con người và cho thấy rất nhiều điều về con người, trong khi bản thân con người lại không biết nhiều về dữ liệu.

Theo ông Pierre Bonnet, dữ liệu về con người và cuộc sống xung quanh một người, một nhóm người có thể được thu thập về lưu trữ ở bất cứ đâu trên thế giới, thông qua hệ thống internet, mạng xã hội, những tiện ích khác... mà họ chưa hiểu để kiểm soát được. Lượng dữ liệu thu thập đó đến một thời điểm nhất định sẽ có khả năng kiểm soát được cá nhân hay nhóm người liên quan đến dữ liệu.

Ông Pierre Bonnet, nhà sáng lập Smart-up.org kiêm Giám đốc vận hành Orchestra Networks

"Nếu không có sự kiểm soát tốt về dữ liệu sẽ đến một thời điểm dữ liệu kiểm soát con người thay vì con người có thể kiểm soát dữ liệu", ông Pierre khẳng định.

Giám đốc vận hành Orchestra Networks cũng cho rằng, dữ liệu chính xác đóng vai trò quyết định trong hầu hết kết quả kinh doanh, kế hoạch phát triển dài hạn của một doanh nghiệp, ngành nghề, lĩnh vực hay Chính phủ của một quốc gia.

Dữ liệu là thành phần cực kỳ quan trọng. Với hơn 60% người dân sử dụng internet, Việt Nam là quốc gia đứng thứ 16 trên thế giới về số lượng người sử dụng internet cùng với đó là lượng dữ liệu cực lớn. Tuy nhiên, ông Pierre đánh giá, đa số doanh nghiệp, tổ chức, cơ quan tại Việt Nam chưa nắm được cách quản trị được dữ liệu đó.

Cùng quan điểm, ông Vũ Minh Trí, Phó Tổng Giám đốc VNG nhận định, có tới 90% dữ liệu tại Việt Nam là dữ liệu không có cấu trúc. Nguy hiểm hơn, 50% trong số dữ liệu không có cấu trúc đó lại không được bảo vệ, dẫn đến việc có thể bị thay đổi, bóp méo dữ liệu đó, tạo nên sự hỗn loạn data.

Theo giới chuyên gia, thách thức lớn nhất hiện nay của Việt Nam trong việc thực hiện hệ sinh thái số, phát triển kinh tế số, hướng đến Chính phủ điện tử... chính là nền tảng dữ liệu và làm sao để thị trường, doanh nghiệp, các tổ chức hiểu được tầm quan trọng của dữ liệu.

Ông Vũ Minh Trí, Phó Tổng Giám đốc VNG
Dữ liệu được ví như nguồn "dầu mỏ" của thế giới công nghệ 4.0, nhưng khác với dầu mỏ là dữ liệu thì không có biên giới. Dữ liệu của Việt Nam có thể khu trú ở những nơi khác nhau và không kết nối với nhau.

Ví như Việt Nam có dữ liệu rất lớn về ngân hàng nhưng lại không được kết nối để phân tích được hành vi tiêu dùng, trình độ học vấn… Thêm vào đó là ranh giới giữa việc khai thác dữ liệu và xâm phạm đời tư rất mờ nhạt. Một loạt các vụ việc rò rỉ thông tin khách hàng của các doanh nghiệp thương mại điện tử trong thời gian qua là minh chứng rõ rệt.

Theo ông Vũ Minh Trí, Việt Nam cần có chính sách rõ ràng về quản trị dữ liệu. Từ dữ liệu chung, cơ quan quản lý có thể xác định được xu hướng dữ liệu như Việt Nam có những tầng lớp nào? Hành vi của mỗi tầng lớp là gì? Top 10 nhãn hiệu họ hay sử dụng nhất... Đấy chính là những dữ liệu rất có ích cho mảng bán lẻ, kinh doanh hàng tiêu dùng, chứ không tới mức biết được các thông tin cá nhân như email của người dùng, thu nhập bao nhiêu, chi tiêu bao nhiêu, gia đình bao nhiêu đứa con…

Quản trị dữ liệu đang được coi là thử thách lớn nhất của hệ sinh thái số. Việt Nam đang có hạ tầng 4G, chuẩn bị kết nối 5G, nhưng phần khai thác, phân tích dữ liệu và chính sách về dữ liệu chưa có thì rất khó để xây dựng hệ sinh thái số.

Dự đoán, đến năm 2020, khối lượng dữ liệu sẽ đạt 44.000 tỷ gigabytes, với khoảng 50,1 tỷ thiết bị IoT sẽ kết nối với nhau, tức là trung bình mỗi người sở hữu 6 thiết bị IoT. Khi đó, dữ liệu sẽ là cơ hội và cũng là thách thức để mỗi quốc gia vượt lên trong cách mạng công nghiệp 4.0./.