Làm gì khi dữ liệu trở nên quá lớn?

1664
Rear view of stock trader with hands on head looking at graphs on screens

Diminishing returns – điểm hiệu suất giảm dần trong dữ liệu Big Data giờ đây là hoàn toàn có thể xảy ra. Vì vậy dưới đây là các gợi ý làm sao để tránh bị sa lầy vào những thông tin thừa thải không cần thiết.

Vào những thập niên 50, các nhà khoa học đã nhận định rằng não người chỉ có thể ghi nhớ khoảng 7 vật thể. Khả năng của não người  tới nay vẫn chưa thay đổi nhiều – nhưng lượng dữ liệu mà chúng ta đang tiếp nhận thì rõ ràng ngày càng nhiều hơn

Don Sullivan – Product line Marketing Manager của VMware  cho biết: “Chúng ta đã có tất cả các dữ liệu cần, nhưng cái các công ty còn thiếu là những người có sự nhạy bén kinh doanh để biến những cái họ học được về phân tích dữ liệu thành những cơ hội đột phá cho doanh nghiệp” .

Tôi đã tham dự Microsoft PASS Summit gần đây với Sullivan, một hội nghị dành cho các DBA và các chuyên gia phân tích dùng Microsoft và các platform dữ liệu và công cụ phân tích liên quan.

Tại hội nghị, tôi đã thấy được nhiều công cụ tự động hóa database ưu tú mà có thể sử dụng cho nhiều bộ dữ liệu khác nhau và tiến hành các thao tác xáo trộn database, data và ứng dụng – nhưng bên cạnh đó, chính hội nghị cũng thiếu trầm trọng các thảo luận về cách làm thế nào để sử dụng những nguồn dữ liệu quý giá này và biến chúng thành những giá trị kinh doanh có giá trị và hữu ích.

Tôi tự hỏi: Bao nhiêu dữ liệu là đủ?

Trong hệ thống giám sát và sản xuất, chúng ta đang có các bộ máy có thể giao tiếp với nhau trên nền sản xuất và các endpoints giao tiếp với nhau trong hệ thống mạng doanh nghiệp. Các bộ máy và các endpoints sẽ thu thập và truyền đi các mảng thông tin có giá trị  – tuy nhiên những thông tin này cũng sẽ được gán như các loại *rác hệ thống* không có giá trị (worthless machine gibberish). Các nhà quản trị mạng có thật sự cần đến nó?

Mã vạch thông minh giờ đây có thể chứa đến 7000 kí tự dữ liệu cho một sản món hàng.  Ví dụ, mã vạch trên một chiếc áo phông có thể cho biết cái áo đó có tổng cộng bao nhiêu mũi khâu. Nhưng bạn có thật sự cần đến thông tin này không, khi công việc của bạn chỉ là đảm bảo rằng sản phẩm được chuyển đi khỏi chỗ sản suất đúng hạn chưa và sẽ có sẵn tại kho hàng hay đại lí bán lẻ đúng han để phục vụ cho dịp lễ tết hay không?

Nói cách khác, cho dù chúng ta có bàn về Network outputs, áo hay tín hiệu video TV, dường như sẽ có một điểm hiệu suất giảm dần (diminishing return).  Mà tại đó giá trị mà bạn thu được  từ dữ liệu của mình bắt dầu giảm xuống.

Có 2 điểm mấu chốt chính của sự giảm dần giá trị dữ liệu gồm:

  • Dữ liệu bắt đầu được đưa ra mà không có business case để sản xuất ra nó
  • Dữ liệu được trình bày một cách quá phức tạp mà người dùng chỉ đơn giản là không biết phải làm gì với chúng

Dưới đây là các đề xuất cho bạn để có thể trung hòa các mấu chốt trên:

Giải pháp cho dữ liệu không có business case

  • Luôn phải xác định rõ business case cùng với các kết quả kì vọng ( Vd: giảm chi phí vận hành trong sản xuất) trước khi thiết kế trung tâm dữ liệu, plugging trong IoT,… Bạn tập trung càng sâu vào mục tiêu của mình, thì nhân viên của bạn càng có khả năng sẽ tiếp tục công việc.
  • Hàng tuần, kiểm tra phân tích dữ liệu cho dự án “chuyển”. Nói cách khác, dự án có đang dần lệch khỏi các business case cần được giải quyết không? Nếu như bạn thấy được dự án đang bắt đầu bị lệch, hãy điều chỉnh lại nó theo đúng business case
  • Không bao giờ giao dự án phân tích vào tay chỉ một kỹ thuật viên. Nếu thiếu người hiểu biết về kinh doanh, thì dự án có thể sẽ là một kiệt tác kỹ thuật, nhưng lại là một thảm họa kinh doanh. Để tránh được cạm bẫy này, một người dùng cuối am hiểu về kinh doanh hoặc một nhà phân tích IT business nên là người nắm vị trí lead để đảm bảo tương thích giữa dự án và mục tiêu kinh doanh.

Giải pháp cho dữ liệu quá phức tạp, hoặc kể cả quá nhiều

  • Hiểu rõ người dùng cuối cần gì trước khi bạn bắt đầu thiết kế một ứng dụng phân tích. Nếu người dùng đang làm việc ngoài trời trong một sân lạnh và mưa, họ không cần phải đấu tranh với các lớp menu kéo xuống trên một thiết bị di động. Một hình ảnh duy nhất cho thấy vị trí của trailers và nhấn mạnh vấn đề then chốt có thể là đủ.
  • Theo đuổi đến cùng các business case của bạn. Nếu mục tiêu là để xem có bao nhiêu trường hợp bệnh cúm ở các huyện khác nhau của thành phố, đi với nó đến cùng. Dự án ngày mai có thể để thêm đặc điểm nhân khẩu học như yếu tố ảnh hưởng đến tỷ lệ thất nghiệp, vv, nhưng nó không phải là công việc của ngày hôm nay..

Source: TechRepublic