LifeKeeper For Windows 提供了一個完全容錯的軟件解決方案,并提供數(shù)據(jù)、應(yīng)用程序和通信資源的高度可用性。 LifeKeeper 不需要任何特別的容錯硬件。你可以集合使用二到三十二個 Windows 結(jié)點。并訪問特定地點的配置數(shù)據(jù)。然后, LifeKeeper 會自動地提供錯誤檢測和多層現(xiàn)場恢復(fù)。
在出現(xiàn)故障的情況下, LifeKeeper 會將保護資源自動轉(zhuǎn)換到一個根據(jù)優(yōu)先權(quán)而設(shè)定的系統(tǒng)。在實際進行切換用戶時,會經(jīng)歷一個十分短暫的休眠,但是,當系統(tǒng)完成了切換操作后, LifeKeeper 會在所選擇的系統(tǒng)上自動地恢復(fù)操作。
可以被 LifeKeeper 保護起來的資源是:
? 卷(Volume)
? IP 地址
? 共享文件
? LAN (局域網(wǎng))管理器服務(wù)器名稱
? 應(yīng)用程序
? 定義的用戶
? MSCS 應(yīng)用程序
2 、心跳故障檢測 Heartbeat
LifeKeeper 在集群節(jié)點間保持著間歇的通信信號,也叫做心跳信號,是錯誤檢測的一個機制。即通過每一個通信路徑,在兩個對等系統(tǒng)之間進行周期性的握手 , 如果連續(xù)沒有收到的心跳信號到了一定的數(shù)目, LifeKeeper 就把這條路徑標示為失效(紅色)。
如果你只定義了一條通信路徑,當 LifeKeeper 把這唯一的一條通信路徑標為失效時, LifeKeeper 便立即開始恢復(fù)過程。然而,如果你有冗余路徑, LifeKeeper 能夠通過第二條路徑確定是系統(tǒng)故障還是只是通信路徑有問題。如果 LifeKeeper 開啟優(yōu)先級第二的通信路徑并收到了心跳信號,它就不開始 failover 恢復(fù),只需要把第一條通信路徑標成紅色(失效),作為信號告訴你需要修理一下有故障的路徑。
一般情況下 LifeKeeper 只在下列事件發(fā)生時,啟動系統(tǒng)恢復(fù)功能:
? 所有的通信路徑故障。如果所有節(jié)點都沒能收到心跳信號, 把所有通信路徑都標為失效, Lifekeeper 開始安全檢查。
? 安全檢查失敗。當所有通信路徑故障時, LifeKeeper 向整個網(wǎng)絡(luò)發(fā)出安全檢查信號。如果信號指出配對系統(tǒng)還“活”著的時候, LifeKeeper 不啟動 Failover 。如果安全檢查沒從配對節(jié)點返回信號, LifeKeeper 就開始 Failover 。
因而,為了減少由于潛在的通訊錯誤所引起的不必要的系統(tǒng)切換,建議您使用不同介質(zhì)的多條通信路徑。