Ảnh Data Lake

Hồ dữ liệu là gì?

Hồ dữ liệu (Data Lake) là một hệ thống hoặc kho dữ liệu được lưu trữ ở định dạng tự nhiên, thường là các đốm màu hoặc tệp đối tượng. Hồ dữ liệu (Data Lake) thường là một kho dữ liệu đơn lẻ bao gồm các bản sao thô của dữ liệu hệ thống nguồn, dữ liệu cảm biến, dữ liệu xã hội, v.v., và dữ liệu đã biến đổi được sử dụng cho các tác vụ như báo cáo, trực quan hóa, phân tích nâng cao và machine learning. Một hồ dữ liệu (Data Lake) có thể bao gồm

  • Dữ liệu có cấu trúc từ cơ sở dữ liệu quan hệ (hàng và cột)
  • Dữ liệu bán cấu trúc (CSV, nhật ký, XML, JSON)
  • Dữ liệu phi cấu trúc (email, tài liệu, PDF)
  • Dữ liệu nhị phân (hình ảnh, âm thanh, video)
Star Rating
Data Lake
grid view
list view

Đăng ký nhận bản tin của chúng tôi

Tra cứu thông tin nhà cung cấp và tìm kiếm giải pháp tốt nhất dành cho bạn

!