Tất tần tật về lưu trữ dữ liệu trên Azure

6172

Microsoft Azure có rất nhiều tùy chọn để lưu trữ dữ liệu, vậy bạn nên chọn cách nào để phù hợp? Bài hướng dẫn này sẽ giải thích cụ thể về các lựa chọn.

Lựa chọn đúng hình thức lưu trữ đám mây (cloud storage) chưa bao giờ đơn giản như bạn nghĩ. Bạn sẽ phải lựa chọn thật cẩn thận, để save và read data của bạn, cho băng thông (bandwidth) và ngay cả đối với class máy chủ lưu trữ dữ liệu của bạn.

Câu hỏi đầu tiên là “Kiểu dữ liệu cần lưu là gì?” Các dịch vụ đám mây (cloud service) có cơ hội vượt qua mô hình phân tầng (tiering model) mà chúng ta thường sử dụng trong cơ sở hạ tầng on-premises (phiên bản tải về), hãy sử dụng các mô hình lưu trữ phù hợp hơn với các ứng dụng đám mây và nhu cầu cụ thể của chúng ta. Chúng có thể trông giống như ổ cứng ngoài, nhưng bạn sẽ phải làm việc với code đặc biệt mà không được cung cấp các tính năng tương tự như một hệ thống quản lý file đa dụng.

Nhưng đừng lo quá tập trung vào vấn đề chuyên sâu. Hệ thống disk file hiện đại là những công cụ phức tạp, được thiết kế để xử lý bất cứ điều gì bạn có thể làm với máy tính hoặc máy chủ. Bằng cách tập trung vào một nhiệm vụ cụ thể, các hệ thống cloud file có thể điều chỉnh các tính năng hiệu suất và độ tin cậy, việc xây dựng phần cứng cơ bản và trên các hệ thống file mới hơn và đáng tin cậy hơn, chỉ mới bắt đầu triển khai trên toàn thế giới.

Tìm hiểu về BLOB store của Azure

Microsoft đã cố gắng cung cấp một hệ thống object file cho Windows và đã thất bại. Có quá nhiều chi phí trong việc xây dựng và quản lý một index cho tất cả các loại file khác nhau được lưu trữ trên máy PC.

Trên Azure, mọi thứ đều khác nhau. Thay vì phải quản lý dữ liệu ở mức hệ điều hành (operating-system), hệ thống object file của Azure sẽ để lại mọi thứ cho đến mã của bạn. Rốt cuộc, bạn đang lưu trữ và quản lý dữ liệu cần thiết bởi chỉ một ứng dụng, do đó công việc quản lý trở nên đơn giản hơn nhiều.

Đó là điều blob storage của Azure hướng đến. Blobs là những đối tượng nhị phân lớn, dữ liệu phi cấu trúc mà bạn muốn lưu trữ. Với giao diện RESTful, blob store của Azure giảm bớt rất nhiều sự phức tạp của việc xử lý các file và nền tảng Azure đảm bảo rằng cùng một đối tượng có sẵn trên nhiều bản sao lưu trữ, sử dụng tính nhất quán để đảm bảo rằng tất cả các phiên bản của một bản ghi chính xác trước khi đối tượng có thể được read. Dữ liệu có thể được phân lớp, tùy thuộc vào tần suất bạn mong đợi nó được read, với hot, cold và preview của các tùy chọn lưu trữ có sẵn.

Sử dụng blob storage có nghĩa khi bạn đang viết code mà cần truy cập media hoặc content khác, một blob có thể đơn giản chỉ là một hình ảnh từ catalog, hoặc một tài liệu trong một hệ thống quản lý content doanh nghiệp. Tất cả bạn cần làm là xây dựng một index và sau đó dẫn đến store. Nó sẽ được sao chép đến tất cả các vùng bạn đang sử dụng để lưu trữ ứng dụng của bạn.

Tìm hiểu về các file trên Azure

Không phải mọi đoạn code đều được sinh ra trong cloud và không phải mọi dự án đều cần phải viết lại trên Azure. Nếu bạn đang lưu trữ tại các ứng dụng Windows Server và Linux hoặc trong các container hoặc các máy chủ ảo IaaS, có thể bạn cần một số file lưu trữ dựa trên hoạt động với các giao thức quen thuộc.

Đó là nơi cất giữ Azure File dựa trên SMB 3.0, sử dụng một giao thức quen thuộc với cả nền tảng Windows và Linux. Nó cũng có một REST API, vì vậy bạn có thể viết code chống lại nó, nhờ đó các ứng dụng mới và cũ có thể chia sẻ lưu trữ giống nhau và thậm chí sử dụng VPN để kết nối với Azure storage từ các ứng dụng on-premises.

Sử dụng kết hợp BLOB và file trong Azure

Điều quan trọng cần lưu ý là một tài khoản Azure storage có thể chứa các trường hợp của cả hai file lưu trữ và file blob và có thể lập trình sao chép dữ liệu từ một store khác.

Điều này cho phép bạn sử dụng lưu trữ trên cloud-hosted làm ranh giới giữa ứng dụng on-premises và cloud code, tải file lên và dữ liệu lên storage trên cloud trên file trước khi tự động sao chép tới một blob store chạy trên cùng một tài khoản bằng cách sử dụng REST API của Azure và các bản SDK lưu trữ từ code của bạn.

Sử dụng physical disk trong Azure

Tất nhiên, không chỉ giới hạn ở các tùy chọn lưu trữ được quản lý trên Azure. Nếu bạn đang viết code hiệu suất cao, bạn có thể cần phải truy cập vào physical disk thực. Với bộ nhớ Azure Disk, bạn có thể nhanh chóng cung cấp ổ SSD hoặc HDD. SSD mang lại cho bạn độ trễ thấp và tốc độ truyền tải cao và lý tưởng để sử dụng với các máy ảo Azure có hiệu năng cao. Bằng cách đó, bạn có thể lift và shift  các ứng dụng on-premises chạy trên SQL Server hoặc Dynamics CRM tới Azure mà không ảnh hưởng đến hiệu suất. Ngoài ra, bạn có thể sử dụng các ổ cứng chậm hơn để lưu trữ dữ liệu cần thiết cho môi trường test, giữ dữ liệu và máy test riêng biệt và kết nối các máy test mới với lưu trữ được cung cấp trước đó – phương pháp tiếp cận này làm tăng tốc độ nhận dữ liệu vào môi trường test.

Dung lượng lưu trữ trên Azure giống như dung lượng disk ở bất cứ nơi đâu: Nó được cố định và không scale với ứng dụng của bạn. Nếu bạn cần thêm dung lượng lưu trữ, bạn sẽ phải cung cấp thêm và gắn kết vào code của bạn để sử dụng nó. Nếu bạn đang lập kế hoạch tự động scale các ứng dụng, bạn cần phải nhớ rằng bộ nhớ disk có thể là một điều trở ngại, đặc biệt nếu bạn đang truy cập nó từ nhiều container hoặc máy ảo cùng một lúc.

Cá nhân hoá trong cloud

Mặc dù các tùy chọn lưu trữ cơ bản trong Azure tốt cho hầu hết các mục đích, Azure cũng cung cấp các dịch vụ lưu trữ chuyên dụng. Một số lượng lớn chất năng hỗ trợ cho các dữ liệu phi cấu trúc, lý tưởng để lưu trữ lượng dữ liệu để phân tích trên quy mô lớn. Ngoài ra còn có queue storage để xử lý các tin nhắn queue khối lượng lớn, quản lý giao tiếp ứng dụng giữa các ứng dụng không đồng bộ (IAC) bằng cách xử lý các tin nhắn queue lớn, có thể tùy ý tiếp cận “sâu” để xử lý lưu lượng dữ liệu truy cập.

Một số dịch vụ lưu trữ của Azure được thiết kế để mở rộng và bảo vệ dữ liệu on-premises. Thiết bị lưu trữ StorSimple giống như các máy chủ lưu trữ, với các bộ nhớ lưu trữ trên hard-disk và SSD. Nhưng những mảng này được coi là bộ nhớ cache cho dữ liệu đang được chuyển đến và từ cloud storage. Azure cung cấp cả dịch vụ sao lưu dự phòng cho các máy tính để bàn và máy chủ on-premises và một tùy chọn phục hồi những tổn hại lớn hơn, không chỉ sao lưu các máy chủ mà còn có thể chạy chúng trong trường hợp ngừng hoạt động.

Lưu trữ tốt, an toàn, là yêu cầu tối thiểu trong thị trường điện toán đám mây công cộng hiện đại. Tuy nhiên, điều thú vị về Azure là khả năng mở rộng của nó, hỗ trợ cả ứng dụng đám mây và code on-premises đang chuyển khỏi các trung tâm dữ liệu hiện tại cũng như cho phép các hybrid scenario.

Những thay đổi gần đây đối với các mô hình về chi phí đang làm cho cloud storage ngày càng hấp dẫn, với khối lượng lớn và chi phí thấp. Bây giờ bạn đã biết các yếu tố cần xem xét khi lựa chọn những hình thức nào phù hợp với bạn và code của bạn.


AI (artificial intelligence) – Trí tuệ nhân tạo hay trí thông minh nhân tạo có thể được định nghĩa như một ngành của khoa học máy tính liên quan đến việc tự động hóa các hành vi thông minh, hay được hiểu như là trí tuệ của máy móc được tạo ra bởi con người; hiện nay  AI được áp dụng trong rất nhiều ngành nghề và công việc khác nhau, ví như có thể dùng để điều khiển một vật thể; có thể phân tích và lập luận để trả lời câu hỏi của khách hàng; hiểu ngôn ngữ để giao tiếp;…

Sự kiện AI – ỨNG DỤNG THỰC TIỄN VÀ CÁCH BẮT ĐẦU sẽ đem đến cho các bạn một cái nhìn tổng quan về AI cũng như các ứng dụng thực tiễn của nó vào một số khía cạnh trong thông qua một số chủ đề:

Topic 1: Triển khai Saas trên nền tảng cloud tối ưu tốc độ và chi phí + Ứng dụng Azure vào mô hình này

Topic 2: Ứng dụng AI vào tối đa hiệu quả marketing của E-commerce & cách ứng dụng Azure vào mô hình này

Topic 3: Ứng dụng AI trong fintech để chống gian lận

Topic 4: Triển khai chatbot thông minh ứng dụng AI trả lời tự động & ứng dụng Azure

AI – Ứng dụng thực tiễn và cách bắt đầu

Tp Hồ Chí Minh : Dreamplex 2, 195 Điện Biên Phủ, F.15, Q. Bình Thạnh 

^FBCB3E50DB113E7C896A008997E52E67C2DF29F07B5E587F11^pimgpsh_fullsize_distr

Techtalk via Infoworld

CHIA SẺ