本地業務連續性+異地數據容災解決方案[2015-08-19]
- 客戶需求分析
項目實施目標:
1. 業務連續性:業務系統搭建高可用解決方案,即當任意一臺服務器故障或應用故障,需要進行業務切換,確保業務連續性。
2. 異地容災備份:為了防止業務系統關鍵數據意外丟失或損壞,需要建立數據異地容災備份方案,實現異地數據的容災恢復。
3. 本地集群完全故障的時候,需要手動(自動)啟用異地機器上的應用對外提供服務。
4. 可靠性和易維護性:業務系統關系著該企業的正常運營工作,需要確保安全無故障運行,并且提供簡介、方便、易用、有效地管理流程與管理界面,以便維護人員的日常管理和維護。
- 解決方案
1. 總體架構描述
在客戶機房新增一臺服務器,新增服務器作為本地業務系統的備援服務器;在客戶的容災機房新增一臺服務器,作為業務系統的異地容災備份中心。新增的兩臺服務器上安裝與生產服務器完全一致的操作系統和相關應用。在三臺機器上通過RoseReplicator GHA解決方案搭建基于集群系統的遠程數據容災系統。
2. 具體實現過程
2.1客戶本地生產機房業務連續性保護實現過程
首先,客戶的一臺服務器A作為業務系統的主服務器,承擔業務系統所有的業務訪問工作,另一臺服務器B作為業務系統的備援服務器。業務系統的數據均存放在連接A、B兩臺服務器的共享存儲上。
其次,服務器B作為服務器A的備援服務器,通過心跳線周期的監控主機的運行狀態,即當業務系統出現任何不可修復的故障或需要脫機維護時,RoseReplicator GHA自動將業務系統切換到服務器B上,繼續為客戶端提供不間斷的服務,確保業務系統的持續運營工作。

拓撲圖1:業務系統RoseReplicator GHA雙機的拓撲圖
2.2 RoseReplicator GHA實現本地業務連續性以及異地數據容災過程
業務系統在RoseReplicator GHA的保護下,實現了本地業務系統的業務連續性保護,但是這對于業務系統應用及相關核心數據的保護是遠遠不夠的,必須考慮到本地集群系統發生極端集群故障(如火災)時的應對方案,需要為業務系統建立一個遠程數據容災解決方案。該方案既可以在本地集群正常工作的時候,對共享數據實施數據保護,也可以在本地集群故障后,通過異地容災服務器RoseReplicator GHA的恢復向導,將數據恢復到指定的服務器,恢復用戶的業務系統,雷安公司提供的RoseReplicator GHA就是針對集群環境實現共享數據遠程容災、災難恢復的解決方案。
RoseReplicator GHA實時監控本地業務連續性保護集群環境的運行狀態,并將生產主機所產生的數據壓縮加密后通過網絡傳輸到異地容災備份中心,形成集群共享數據的實時數據副本。當本地集群發生極端故障時,異地容災服務器還保存著一份業務系統的生產數據,確保企業核心數據的安全。
Rose容災系統配合硬件環境搭建集群業務連續性及數據災難恢復解決方示意圖如圖“拓撲圖 2”所示。

拓撲圖2: 業務系統容災系統拓撲圖RoseReplicator GHA
- 方案效果
當系統出現故障時(如:系統宕機、服務器硬件故障,應用進程被殺掉、RS-232/存儲連線/網絡線纜斷開),RoseReplicator GHA將確定由于某種故障而終止的應用,并將這些應用切換到備份服務器上,續對外提供服務。
2、無縫集成于既有環境
RoseReplicator GHA具有良好的兼容性,整個方案完全根據客戶需求及環境所設計,最大限度地利用了客戶既有資源,且簡單易用,無形中降低了信息系統的總體擁有成本,減低了TCO,提高了ROI。
3、提高網絡可靠性
如果服務器的網絡部分發生故障,會導致客戶不能連接和訪問到服務器,這同樣是致命的故障。在網絡滿足運行條件的前提下,RoseReplicator GHA可以實現當主機網絡故障時候,備機可以接管繼續對外提供服務,當備機網絡故障時候,容災機器可以繼續對外提供服務。
4、全面的遠程容災策略
通過RoseReplicator GHA搭建本地雙機集群保護業務系統連續工作,為避免因本地群集環境需要定期維護、系統升級、站點丟失等原因導致業務中斷,遠程災難恢復中心可暫時接管應用服務,確保業務系統的連續運營。
5、成熟的數據復制技術
RoseReplicator GHA是一款專門針對群集環境而研制的容災軟件,其利用遠程數據復制技術,讓遠程災難恢復中心存儲一份與本地群集環境完全一致的數據副本,達到群集環境數據容災目標。
6、 快照管理
RoseReplicator GHA集成了VSS服務,為企業關鍵數據提供邏輯層面的數據保護能力,用戶可以利用VSS功能實現數據快照和快照備份等全方位保護業務數據的完整,一致性。
通過快照功能對容災服務器數據進行快照備份,可選擇計劃快照,自動快照,手動快照,根據實際需要,可將快照快速恢復到源主機或者第三方主機,增強數據的安全性和恢復效率。
7、簡潔直觀的遠程集中管理模式
可以在網絡中的任何一個地方管理網絡中所有可見的集群主機,實現中心化的遠程管理。同時,簡潔形象的管理界面,使得管理維護成為非常簡單的事情,大大降低了系統的實施和維護成本。
通過實施以上功能特點,為該單位的業務系統,成功部署了新的業務連續性和容災保護策略。利用RoseReplicator GHA的高效簡潔的GUI管理工具,以及對應用程序服務強大的管理監控能力,業務系統實現了業務連續性運營,信息的利用率明顯提高,工作效率也大大增強,有效地促進了該單位的業務拓展。
- 方案總結
其次,整個方案是完全根據客戶需求及現有環境所設計,有效利用了客戶既有資源,且簡單易用,無形中降低了信息系統的總體擁有成本,提高了ROI。