“By 2019, 70% of existing storage array products will also be available as software only version”
Innovation Insight: Separating Hype From Hope for Software-Defined Storage
“By 2020, between 70-80% of unstructured data will be held on lower-cost storage managed by SDS”
Innovation Insight: Separating Hype From Hope for Software-Defined Storage
Trước tiên chúng ta cần nhìn lại vào lịch sử của các hệ thống lưu trữ, thiết bị lưu trữ đầu tiên IBM 701 Tape Drive cho dữ liệu máy tính được sản xuất 1949 với chỉ vỏn vẹn 1024 bits nhưng là tất cả đối với nền công nghệ lưu trữ lúc bấy giờ. Sự phát triển của công nghệ luôn đi kèm với sự tăng trưởng của dữ liệu. Hãy nhớ rằng chúng ta đã từng có floppy disk với 1.44MB, USB 128 MB hay CD/DVD rồi dần bị thay thế bởi các loại HDD/SSD dung lượng lên đến hàng TB.
Hệ thống lưu trữ doanh nghiệp cũng có những cải tiến vượt trội, từ thời kỳ của máy chủ vật lý với việc cài đặt ứng dụng của doanh nghiệp trên từng server đơn lẻ đến sự bùng nổ của các hệ thống ảo hoá với khả năng cluster các máy vật lý chạy trên một nền tảng Shared Storage systems như SAN (Storage Area Network), NAS (Network-Attached Storage) cho đến thời đại cloud computing như hiện nay. Hàng loạt các hãng phần cứng cũng đưa ra những sản phẩm về storage nổi trội và cạnh tranh từng chút một về tính năng cũng như hỗ trợ việc quản trị cho Sys Admin như IBM, Dell, HP, Netapp, Hitachi,… Mặt trái của các hệ thống storage truyền thống chính là tính bao đóng và độc quyền về cả phần cứng lẫn software dẫn đến giá thành đắt đỏ của thiết bị hơn hết là kiến trúc monolithic và controller-centric ảnh hưởng trực tiếp đến khả năng scale và hiệu năng của storage.
Sự phát triển của nền công nghiệp 4.0 với các nền tảng BigData, AI, IoT ra đời cùng với sự tăng trưởng nhanh dữ liệu quan trọng trong doanh nghiệp theo thời gian khiến cho các hệ thống storage truyền thống dần không còn đủ khả năng để đáp ứng được theo mô hình mới này. Chúng ta có thể điểm qua những yếu tố như sau:
- Khả năng tăng trưởng dữ liệu cấp số nhân trong thời đại kỹ thuật số nhưng vẫn đáp ưng tiêu chí về dung lượng (capacity), mở rộng không giới hạn (scalability) và giá thành (cost).
- Truy cập dữ liệu mọi lúc, mọi nơi trên mọi thiết bị.
- Các modern service yêu cầu khả năng tuỳ biến để lưu trữ on-premise hoặc cloud.
- Sự tăng trưởng dữ liệu đi kèm với tăng cường data protection để đảm bảo tính nhất quán và HA ở quy mô lớn.
Thiết bị SAN/NAS sẽ dần được thay thế
Xuyên suốt khoảng 20 năm vừa qua, các hệ thống storage ở doanh nghiệp luôn được ngầm định là hệ thống bao đóng được cung cấp toàn bộ về hardware, software bởi vendor đôi khi bao gồm cả việc triển khai mở rộng, việc quản trị sử dụng khá phức tạp cần có admin thao tác trước khi user có thể truy cập vào sử dụng những hệ thống này thích hợp cho một ứng dụng riêng biệt, sử dụng network local, giới hạn khả năng scale tủ đĩa và performance do kiến trúc controller-centric.
Sự bùng nổ nhanh chóng của của dữ liệu đòi hỏi hệ thống cần có khả năng mở rộng lớn, truy cập local hoặc cả remote, thời gian uptime cao và song hành là các giải pháp automation hỗ trợ vận hành, mở rộng nhanh chóng đối với hệ thống lớn. Với yêu cầu cấp thiết của hệ thống mở rộng đến hàng petabyte, ngày nay các thiết bị storage appliances phải đầu tư chi phí rất lớn để đáp ứng, quản trị và mở rộng. Nhận ra được yếu tố trên nhiều doanh nghiệp đang dần lựa chọn một hướng đi mới phù hợp với khả năng của họ hơn. Một hệ thống có kiến trúc linh hoạt, server-based và tiết kiệm.
Software-defined storage (SDS) – ra đời và đã trở thành xu hướng được thiết kế để mang đến những lợi ích cho tổ chức doanh nghiệp giúp họ xây dựng và phát triển một hệ thống lưu trữ hiệu quả, linh hoạt server-based, khả năng mở rộng lớn cũng như chi phí hợp lý.
“By 2016, server-based storage solutions will lower storage hardware costs by 50% or more”
Gartner: “IT Leaders Can Benefit From Disruptive Innovation in the Storage Industry”
Server-based storage is “will account for over 60% of shipments long term.”
Credit Suisse Storage Update, Sep 3, 2015
Lợi thế của Software-Defined storage?
Server-based: Tính chất flexible của software mang lại lợi thế cho SDS có thể triển khai hầu hết trên các loại phần cứng tiêu chuẩn để cung cấp đầy đủ các giao thức trên cùng một hệ storage thay vì phải đầu tư từng phân hệ như hệ thống storage appliances. Mang lại khả năng scale nhanh chóng và hiệu quả.
Kiến trúc phân tán (Distributed): Mỗi thành phần của một hệ thống SDS không chỉ mở rộng về không gian lưu trữ mà còn bổ sung hiệu năng của node đó vào tổng thể, với các thiết bị truyền thống sẽ giới hạn khả năng scale song hành với hiệu năng đáp ứng được của thành phần controller.
Storage Orchestration: Các giải pháp SDS thường sẽ đi kèm với bộ toolkit hỗ trợ các quá trình automation triển khai, thu hồi, scale out, thay đổi cấu hình, tuning theo nhu cầu của người dùng hoặc tự động.
Robustness of software: SDS đem tính linh hoạt của software vào hệ sinh thái storage dễ dàng làm được những thứ vốn dĩ là hạn chế của hệ thống appliance truyền thống như:
- Dễ dàng triển khai trên vật lý, VMs, container và cả public cloud
- Có thể cài đặt trên một máy chủ duy nhất hoặc scale đến hàng trăm máy chủ với khả năng upgrade hoặc thay đổi config khi đang hoạt động
- Mở rộng và thu hồi một cách nhanh chóng với các bước đã được lập trình trước
Những hệ thống lưu trữ storage appliance thường dùng các công nghệ như RAID để bảo vệ dữ liệu khỏi việc hỏng hardware. Hiện nay cơ chế này cũng không còn thiết thực khi mà các đĩa cứng đã lên đến hàng terabytes dẫn đến việc tốn rất nhiều thời gian đễ khôi phục đĩa hỏng cũng như hạn chế trong khả năng chịu lỗi của thiết bị. Software-defined storage được xây dựng với những thuật toán như replicated và erasure-code tăng cường khả năng chịu lỗi đồng thời sẽ không phụ thuộc vào thiết bị vật lý tạo nên sự đa dạng trong chiến lược xây dựng storage của mỗi doanh nghiệp cho từng loại ứng dụng như: performance-optimized, capacity-optimized và throughput-optimized.
Tính năng cũng như hiệu năng của SDS cũng đang dần được tối ưu và phát triển qua từng phiên bản nhằm phục vụ cho modern application. Các tính năng về bảo vệ dữ liệu cũng như high-availibility luôn được quan tâm và cải tiến, ngày nay SDS không còn chỉ nằm trong một trung tâm dữ liệu nữa mà đã có các kiến trúc hỗ trợ mult-site replication, mirror dữ liệu realtime ra nhiều location khác nhau đảm bảo tính durability cho các dữ liệu critical của doanh nghiệp. Và còn hơn thế nữa là các tính năng phục vụ cho container, k8s và các ứng dụng cloud-native luôn là những key-feature cho các nhà phát triển giúp đưa nền tảng software-defined storage ngày càng trở nên gần hơn đối với doanh nghiệp so với các hệ thống storage truyền thống đã dần trở nên không phù hợp với xu thế phát triển dữ liệu ngày nay.