GIẢI PHÁP SYNOLOGY HIGH AVAILABILITY (SHA) – GIẢI PHÁP TRIỂN KHAI 02 MÁY CHỦ NAS SYNOLOGY CHẠY SONG SONG

Giới thiệu
Khả năng hoạt động liên tục là một mục tiêu quan trọng đối với tất cả doanh nghiệp, tuy nhiên có đến 50% các doanh nghiệp SMB trên toàn thế giới vẫn chưa có giải pháp chuẩn bị để khắc phục cho thảm hoạ mất dữ liệu.
Chính vì vậy, giải pháp Synology High Availability (SHA) sẽ giúp doanh nghiệp vượt qua những khó khăn kể trên bằng cách đảm bảo cho một hệ thống dịch vụ lưu trữ hoạt động liên tục với việc tối ưu hoá tính sẵn sàng của hệt thống, giảm tối thiểu nguy cơ gián đoạn và thời gian chết do ngừng hệ thống.

Giới thiệu giải pháp High Availability Clustering
2.1 Synology High-Availability Cluster (Cụm máy chủ có tính sẵn sàng cao)
Synology High-Availability Cluster là giải pháp bố trí các máy chủ được thiết kế để giảm thiểu sự gián đoạn dịch vụ do trục trặc hệ thống. Giải pháp sử dụng nhiều máy chủ để tạo thành một “High Availability Cluster” (cụm máy chủ có tính sẵn sàng cao) bao gồm 02 máy chủ Synology, trong đó một máy chủ được cấu hình để hoạt động như một thiết bị chính (active), và máy chủ còn lại được cấu hình như một máy chủ hoạt động chờ (passive).
2.2 Service Continuity (Dịch vụ liên tục)
Khi một ‘Cụm máy chủ có tính sẵn sàng cao’ (high availability cluster) được hình thành, dữ liệu sẽ liên tục được sao chép từ máy chủ active sang máy chủ passive. Tất cả các tập tin trên máy chủ active sẽ được tạo ra trên máy chủ passive. Trong trường hợp có sự cố nghiêm trọng, máy chủ passive sẽ ngay lập tức sẵn sàng để tiếp nhận tất cả các dịch vụ, và tất cả các dữ liệu trên máy chủ active đã được ánh xạ qua máy chủ passive, nhờ đó đảm bảo tính sẵn sàng cao, và máy chủ passive sẽ tiếp nhận vai trò của máy chủ active để tiếp tục hoạt động bình thường, làm giảm thời gian chết.
2.3 Data Replication Process (Quá trình sao chép dữ liệu)
Trong ‘Cụm máy chủ có tính sẵn sàng cao’ (high availability cluster), tất cả dữ liệu được lưu trong các ổ đĩa nội bộ (internal drives) hoặc trên các đơn vị mở rộng (expansion units) sẽ được sao chép. Do đó, khi tất cả các dịch vụ được chuyển từ máy chủ active sang máy chủ passive, sẽ không có tình huống mất dữ liệu xảy ra.
Trong khi việc sao chép dữ liệu là một quá trình diễn ra liên tục, nó có hai giai đoạn riêng biệt kéo dài từ lúc hình thành đến lúc hoạt động của ‘Cụm máy chủ có tính sẵn sàng cao’ (high availability cluster):
Giai đoạn 1: Việc sao chép ban đầu trong quá trình khởi tạo cụm máy chủ (cluster creation) hoặc việc sao chép các dữ liệu khác biệt khi kết nối đến máy chủ passive hoạt động trở lại sau khi bị ngắt kết nối (chẳng hạn như nguyên nhân do máy chủ active bị tắt hoặc bảo trì). Trong giai đoạn này, việc đồng bộ ban đầu chưa thực sự hoàn tất, và do đó việc chuyển đổi tự động (switchover) không thể được thực hiện.
Giai đoạn 2: Việc sao chép dữ liệu theo thời gian thực sau khi quá trình đồng bộ ban đầu đã hoàn tất. Sau quá trình đồng bộ ban đầu, tất cả dữ liệu sẽ được sao chép theo thời gian thực và sẽ được xứ lý như cam kết nếu sao chép thành công. Trong giai đoạn này, việc chuyển đổi tự động (switchover) có thể được thực hiện bất cứ lúc nào.
Khi bước vào giai đoạn 2 của việc sao chép dữ liệu, tất cả dữ liệu đồng bộ được thực hiện ở cấp độ khối (block-level). Ví dụ, khi ghi một tập tin 10GB, quá trình đồng bộ sẽ được chia nhỏ thành từng khối, và hoàn thành việc đồng bộ từng phần để đảm bảo rằng máy chủ active và passive đều chứa lượng dữ liệu giống hệt nhau. Như vậy, tất cả dữ liệu được đảm bảo duy trì việc cập nhật liên tục, và việc chuyển đổi vai trò máy chủ có thể thực hiện bất cứ lúc nào.
Các dữ liệu sẽ được sao chép, bao gồm:
Dịch vụ dữ liệu trên NAS: Tất cả các dịch vụ tập tin bao gồm CIFS/NFS/AFP
Dịch vụ dữ liệu iSCSI: SHA hỗ trợ iSCSI, bao gồm dịch vụ iSCSI LUN và iSCSI Target
DSM và các dịch vụ khác: Các ứng dụng quản lý, bao gồm cả Synology’s DiskStation Manager (DSM) và các dịch vụ khác của nó và các gói ứng dụng như Mail Server, Directory Server, … bao gồm tất cả các cấu hình và tình trạng các dịch vụ.
Kiến trúc của Cum máy chủ có tính sẵn sàng cao (High Availability Clustering)
3.1 Thành phần vật lý (Physical Components)
Giải pháp SHA xây dựng một cụm máy chủ bao gồm hai hệ thống lưu trữ độc lập, bao gồm một máy chủ active và một máy chủ passive. Mỗi máy chủ có một volume lưu trữ độc lập, nhưng cả hai máy chủ được liên kết bởi một cơ chế kết nối đặc biệt gọi là ‘Heartbeat’, cơ chế này sẽ theo dõi tình trạng của máy chủ và sao chép dữ liệu liên tục giữa 2 máy chủ.

Hình 1: Thành phần vật lý khi triển khai một giải pháp SHA điển hình

Máy chủ Active: trong điều kiện bình thường, tất cả các dịch vụ sẽ được cung cấp bởi máy chủ active. Khi có sự cố nghiêm trọng, máy chủ active sẽ sẵn sàng để chuyển các dịch vụ sang cho máy chủ passive đảm nhận, do đó làm giảm thời gian chết.
Máy chủ Passive: trong điều kiện bình thường, máy chủ passive vẫn hoạt động ở chế độ chờ và nhận một luồng dữ liệu ổn định được sao chép từ máy chủ active sang.
Cơ chế kết nối Heartbeat: Máy chủ active và passive trong giải pháp SHA được liên kết bởi một kết nối mạng riêng chuyên dụng gọi là ‘Heartbeat’. Khi cụm máy chủ được hình thành, kết nối ‘Heartbeat’ sẽ tạo điều kiện cho dữ liệu được đồng bộ hoá. Nó cũng cho phép máy chủ passive liên tục phát hiện sự hiện diện của máy chủ active nhằm cho phép máy chủ passive tiếp nhận ngay vai trò của máy chủ passive trong trường hợp máy chủ active bị lỗi. Kết nối ‘Heartbeat’ ngoài ra cũng được dùng để sao chép dữ liệu từ máy chủ active sang máy chủ passive.
Ghi chú: Kết nối Heartbeat nên được cấu hình trên môi trường mạng có tốc độ nhanh nhất giữa hai máy chủ. Ví dụ, nếu các máy chủ được trang bị các card mạng 10GbE, kết nối Heartbeat nên được cấu hình sử dụng tốc độ 10GbE.
Không gian lưu trữ chính (Main Storage): chính là volume lưu trữ trên máy chủ active
Không gian lưu trữ thay thế (Spare Storage): chính là volume lưu trữ trên máy chủ passive, nơi chứa các dữ liệu liên tục được sao chép về từ máy chủ active
3.2 Kết nối ảo (Virtual Interface)
Kết nối ảo cho phép các máy chủ trong môi trường mạng có thể kết nối tới không gian lưu trữ của SHA với một tên thống nhất và ngăn ngừa việc phải thay đổi cấu hình mạng khi có sự chuyển đổi từ máy chủ active sang máy chủ passive trong trường hợp nó được kích hoạt. Khi cụm máy chủ này được hình thành, các hosts và các clients sẽ phải dùng kết nối ảo của nó để truy cập vào không gian lưu trữ của SHA. Khi đó kết nối ảo này sẽ có địa chỉ IP và tên riêng để sẵn sàng cho việc truy cập.


Hình 2: Các SAN hosts và NAS clients truy cập vào SHA thông qua một kết nối ảo độc lập.
Cluster Server Name and IPs: Các máy chủ trên cụm máy chủ sẽ chia sẻ một địa chỉ IP và tên gọi riêng, theo đó các thiết bị khác có thể truy cập đến tài nguyên của nó thông qua các thông tin này.
3.3 Cấu hình Network
Do kết nối ảo của cụm máy chủ được map trên máy chủ active, kết nối mạng vật lý giữa máy chủ active và máy chủ passive đến dữ liệu mạng phải được cấu hình sao cho tất cả các hosts và clients có thể truy cập vào cả hai máy chủ. Hình ảnh bên dưới minh hoạ một ví dụ cơ bản, theo đó tất cả các máy chủ khác trong mạng có thể kết nối với cụm máy chủ. Trong trường hợp xảy ra sự cố và có sự chuyển đổi vai trò, các dữ liệu vẫn được truy cập bình thường

Hình 3. Cấu hình mạng điển hình của một SHA

Đảm bảo tính liên tục của dịch vụ
4.1 Cơ chế chuyển đổi
Để đảm bảo tính sẵn sàng cao, các dịch vụ phải có thể được chuyển đổi từ máy chủ active sang máy chủ passive trong điều kiện hoạt động bình thường của cụm máy chủ vào bất cứ lúc nào. Cơ chế chuyển đổi (switchover) có thể được kích hoạt bằng tay trong trường hợp cần bảo trì hệ thống, hoặc kích hoạt một cách tự động trong trường hợp máy chủ active có sự cố, lúc này được gọi là chuyển đổi dự phòng (failover). Sau khi vai trò các máy chủ được trao đổi, máy chủ active sẽ tiếp tục đảm nhận lại vai trò của máy chủ passive và hoạt động ở chế độ chờ. Tài nguyên bên trong của cụm máy chủ được truy cập thông qua một kết nối ảo duy nhất, nhờ đó việc chuyển đổi sẽ không làm ảnh hưởng đến các máy chủ khác khi đang truy cập.

Switchover: máy chủ active và máy chủ passive có thể được kích hoạt việc chuyển đổi vai trò bằng tay mà không làm gián đoạn dịch vụ, để phục vụ cho mục đích bảo trì máy chủ.
Failover: trong trường hợp có sự cố nghiêm trọng, cụm máy chủ sẽ tự động kích hoạt việc chuyển đổi dự phòng để duy trì các dịch vụ hoạt động liên tục.
Các trường hợp sau đây có thể được kích hoạt việc chuyển đổi dự phòng:

Crashed RAID Group (Nhóm RAID bị hỏng): nếu một RAID Group trên máy chủ active bị hỏng (crashed) trong khi RAID Group trên máy chủ passive là bình thường, chế độ chuyển đổi dự phòng sẽ được kích hoạt trừ khi không có volumes hoặc iSCSI LUNs (block-level) trên RAID Group bị hỏng. Thời gian quan sát giữa 02 máy chủ là mỗi 30 giây. Do đó, trong trường hợp tồi tệ nhất, việc chuyển đổi sẽ được kích hoạt trong 30 giây sau sự cố.
Service Error (Lỗi dịch vụ): nếu có lỗi xảy ra trong quá trình theo dõi của dịch vụ SHA, việc chuyển đổi dự phòng cũng được kích hoạt. Các dịch vụ có thể được qua sát, theo dõi bao gồm: CIFS, NFS, AFP, FTP, và iSCSI. Dịch vụ theo dõi sẽ thực hiện mỗi 30 giây. Do đó, trong trường hợp tồi tệ nhất, việc chuyển đổi sẽ được kích hoạt trong 30 giây sau sự cố.
Power Interruption (Sự cố mất nguồn): nếu máy chủ active bị tắt hoặc khởi động lại, cả 02 bộ nguồn trên máy chủ active đều bị sự cố, hoặc sự cố mất điện, việc chuyển đổi dự phòng sẽ tự động được kích hoạt. Thời gian theo dõi, giám sát là mỗi 15 giây. Do đó, trong trường hợp tồi tệ nhất, việc chuyển đổi sẽ được kích hoạt trong 15 giây sau sự cố.
Heartbeat and Data Connection Lost (Kết nối Heartbeat và kết nối dữ liệu bị mất): nếu máy chủ passive không thể tìm thấy, phát hiện sự hiện diện của máy chủ active từ cả kết nối Heartbeat và kết nối dữ liệu, việc chuyển đổi dự phòng cũng sẽ được kích hoạt tự động. Thời gian theo dõi, giám sát là mỗi 15 giây. Do đó, trong trường hợp tồi tệ nhất, việc chuyển đổi sẽ được kích hoạt trong 15 giây sau sự cố.
Sau khi chuyển đổi thành công, máy chủ bị lỗi có thể cần phải được thay thế hoặc sửa chữa. Nếu máy chủ bị lỗi đã được sửa chữa, sau khi khởi động lại máy chủ, hệ thống cụm máy chủ SHA sẽ trở lại bình thường và việc đồng bộ dữ liệu sẽ tiếp tục diễn ra như cơ chế đã định. Nếu máy chủ bị lỗi được thay mới hoàn toàn, thì sẽ cần phải cấu hình lại cụm máy chủ để tái tạo lại chức năng như ban đầu của nó. Bất kì một thiết bị USB/eSATA gắn trên máy chủ active sẽ cần phải được gắn lại bằng tay trên máy chủ passive một khi quá trình chuyển đổi đã hoàn tất.
Ghi chú: Khi việc chuyển đổi diễn ra, tất cả các phiên làm việc trên dữ liệu sẽ bị ngắt, do đó việc mất một số dữ liệu đang làm việc tại thời điểm đó có thể xảy ra.
4.2 Thời gian hoàn thành việc chuyển đổi
Khi việc chuyển đổi được kích hoạt, máy chủ active sẽ đổi vai trò thành máy chủ passive, sau đó máy chủ passive sẽ được chuyển thành máy chủ active. Trong suốt quá trình chuyển đổi, sẽ có một khoảng thời gian ngắn, cả hai máy chủ active và passive tạm dừng cung cấp các dịch vụ. Thời gian này mất bao lâu tuỳ thuộc vào số lượng và dung lượng các volumes hoặc iSCSI LUNs (block-level), và tổng số lượng dịch vụ đang chạy trên cụm máy chủ.
Bảng dưới đây sẽ cung cấp cho bạn thời gian ước tính để hoàn thành việc chuyển đổi:

Thử nghiệm với NAS RS10613xs+ và chỉ bật các dịch vụ CIFS, NFS, AFP, FTP và iSCSI, hệ điều hành DSM 4.1

4.3 Chuyển đổi thất bại
Việc chuyển đổi có thể thất bại vì các lý do sau:

Việc sao chép dữ liệu chưa hoàn tất (Incomplete Data Replication): khi các máy chủ ban đầu được kết hợp để tạo thành một cụm máy chủ SHA, cần có một khoảng thời gian để hai máy chủ hoàn tất việc đồng bộ dữ liệu với nhau. Do vậy, khi quá trình này vẫn còn chưa hoàn tất, việc chuyển đổi có thể thất bại.
RAID Group trên máy chủ passive bị hỏng (Passive Server RAID Group Crash): việc chuyển đổi có thể thất bại nếu RAID Group trên máy chủ passive bị hỏng.
Gián đoạn năng lượng (Power Interruption): việc chuyển đổi có thể thất bại nếu máy chủ passive bị tắt hoặc bị khởi động lại, nếu 2 bộ nguồn trên mày chủ passive bị hỏng, hoặc mất nguồn vì bất cứ lsy do gì.
Ghi chú: nếu trong trường hợp việc kích hoạt bằng tay thất bại, hệ thống sẽ tự động chuyển đổi vai trò lại như ban đầu.
Yêu cần cho việc triển khai
Để triển khai giải pháp này, cần 02 máy chủ NAS Synology giống nhau và có hỗ trợ gói ứng dụng SHA. Trước khi hai máy chủ được kết hợp để tạo thành một cụm máy chủ có tính sẵn sàng cao, trình điều khiển SHA sẽ kiểm tra những điều kiện này trước khi cho phép thực hiện bước tiếp theo.
Yêu cầu hệ thống và các giới hạn

Máy chủ Synology: cả hai máy chủ active và passive phải cùng một model và được xác nhận rằng có hỗ trợ chức năng SHA.
Phiên bản DSM: 02 máy chủ active và passive phải cài cùng một phiên bản DSM
Phiên bản gói ứng dụng: gói SHA cùng phiên bản phải được cài trên cả 02 máy chủ.
Lưu ý: chức năng SSH sẽ tự động được bật khi SHA được hình thành.
5.1 Yêu cầu và Giới hạn: Volume và ổ đĩa cứng

Storage Volume: để hỗ trợ việc sao chép đồng bộ dữ liệu, dung lượng lưu trữ trên máy chủ passive phải bằng hoặc lớn hơn dung lượng lưu trữ trên máy chủ active. Tốt nhất là 02 kích cỡ dung lưuợng trên 02 máy chủ nên giống nhau hoàn toàn.
Số lượng ổ đĩa cứng: cả 02 máy chủ active và passive phải có cùng số lượng ổ đĩa cứng, ngoài ra vị trí và số thứ tự ổ cứng cũng phải tương ứng giống nhau.
Synology Hybrid Raid (SHR): trong SHA, chế độ SHR không được hỗ trợ.
5.2 Yêu cầu và Giới hạn: môi trường mạng

Cấu hình mạng: 02 máy chủ phải có địa chỉ IP tĩnh trong cùng subnet
Cổng LAN: 02 máy chủ phải có cùng số lượng cổng mạng, bao gồm cả những card mạng rời
Ghi chú: PPoE, link aggregation, Wi-Fi, và VLAN không được hỗ trợ. Bạn nên tắt các chức năng này trước khi thiết lập một SHA.
5.3 Giới hạn: Quản lý dung lượng lưu trữ
Một khi cụm máy chủ được hình thành, chức năng Storage Manager sẽ không thể thực hiện được các nhiệm vụ: chỉnh sửa, mở rông kích thước volume và iSCSI LUN (block-level), Thay đổi loại RAID
Các chức năng sau sẽ vẫn được duy trì sau khi hình thành cụm máy chủ SHA:

Mở rộng RAID Group bằng cách thêm hoặc thay thế ổ đĩa cứng.
Tạo, xoá, hoặc sửa chữa volume và iSCSC LUN.
Thay đổi kích thước và vị trí iSCSI LUN (file-level)
Thay đổi iSCSI LUN Target
5.4 Yêu cầu về đơn vị mở rộng dung lượng
Các đơn vị mở rộng có thể được gắn thêm vào một khi cụm máy chủ SHA đã hình thành cho mục đích mở rộng dung lượng lưu trữ. Tuy nhiên, cũng như yêu cầu đối với các phần cứng khác, các đơn vị mở rộng gắn trên 02 máy chủ active và passive phải giống nhau hoàn toàn.

Video Demo:

https://youtu.be/NYTKzEKaYcU

Video:Synology’s Franklin demonstrates the upcoming XS+ Series and High Availability Manager

Tham khảo thêm chi tiết tài liệu: Synology_SHA_White_Paper

Liên hệ để được tư vấn:
Công ty TNHH Công nghệ Việt Tuấn
Tel: 024. 35668286 | 0903.209.123
Email: nguyenminh@viettuans.vn | Website: www.viettuans.vn