400-638-8808
|
微信公眾號





穩(wěn)定可靠 永不間斷

海外收發(fā) 暢通無阻

協(xié)同辦公 資源管理

超大郵件 超級功能

智能反垃圾郵件技術(shù)
易管理 免維護

集群服務(wù)可以檢測和隔離網(wǎng)絡(luò)故障。集群服務(wù)使用改進的網(wǎng)絡(luò)故障檢測方法改善故障恢復(fù)操作。故障檢測和防范是服務(wù)器集群所具有的突出優(yōu)點。當(dāng)集:群中的節(jié)點或應(yīng)用程序失效時,集群服務(wù)器可以通過重啟失敗的應(yīng)用程序或?qū)⒐收舷到y(tǒng)的工作分散給幸存的集群節(jié)點來做出響應(yīng)。集群服務(wù)器故障檢測和防范包括雙向故障轉(zhuǎn)移、應(yīng)用程序故障轉(zhuǎn)移、并行恢復(fù)及自動故障恢復(fù)。
.jpg)
集群服務(wù)可以檢測各個資源或整個節(jié)點的故障,并動態(tài)地將應(yīng)用程序、數(shù)據(jù)和文件資源轉(zhuǎn)移到集群中可用的正常服務(wù)器上,然后重新啟動它們。借此, 數(shù)據(jù)庫、共享文件和應(yīng)用程序等資源可以對用戶和客戶端應(yīng)用程序保持高度的可用性。
集群服務(wù)器在設(shè)計上帶有以下兩個不同的故障檢測機制。
• 心跳通信,用于檢測節(jié)點故障。
• 資源監(jiān)視器和資源DLL, 用于檢測資源故障。
.jpg)
1.檢測節(jié)點故障
在集群節(jié)點之間的通信允許集群服務(wù)檢測節(jié)點故障和狀態(tài)改變并且將集群作為一個實體進行管理?梢詾檫@種節(jié)點到節(jié)點的通信設(shè)立多重網(wǎng)絡(luò)以便于消除單一點的故障。在集群節(jié)點上運行的集群服務(wù)跟蹤集群中節(jié)點的當(dāng)前狀態(tài),并且確定組及其資源何時故障轉(zhuǎn)移到備用節(jié)點。這種通信采用在每個節(jié)點的集群服務(wù)之間定期發(fā)送消息的形式進行。這些消息被稱為“檢測信號”,或稱“心跳氣”。
通過心跳通信,每個節(jié)點可以恰查其他節(jié)點及它們的應(yīng)用程序的可用性。如果服務(wù)器設(shè)有對心跳通信;做出響應(yīng),則正常工作的服務(wù)器會啟動故障轉(zhuǎn)移過穩(wěn)(包括對故障服務(wù)器擁有的資源和應(yīng)用程序的所有權(quán)進行仲裁)。仲裁是使用質(zhì)詢和辯護協(xié)議來執(zhí)行的。換而言之,如果某個節(jié)點似乎發(fā)生了故障,則會在給定的時間內(nèi)允許它以幾種方式中的任何一種表明它仍處于正常運行當(dāng)中,并且可以向其他正常的節(jié)點通信。如果它無法證明自己正在正常運行,則此時會將它移出集群。
多種事件都可能導(dǎo)致節(jié)點無法響應(yīng)心跳消息,如計算機故障、網(wǎng)絡(luò)接口故障、網(wǎng)絡(luò)放障,甚于在可能是由于少有的高峰活動期。通常來說,當(dāng)所有節(jié)點進行通信時,配置數(shù)據(jù)庫管理器會向每個節(jié)點發(fā)送全局性的配置數(shù)據(jù)庫更新。當(dāng)心跳通信失敗時,日志管理錦還會將配置數(shù)據(jù)庫的變更保存到仲裁資源中。這保證了幸存的節(jié)點可以在恢復(fù)過程中訪問最新的集群配置和本地節(jié)點的注冊表數(shù)據(jù)。
要注意的是,故障檢測算法相當(dāng)保守。換句話說,它會盡量多地給那些明顯發(fā)生故障的節(jié)點以質(zhì)詢的機會,然后才會進入故障轉(zhuǎn)移過程。如果導(dǎo)致心跳響應(yīng)失敗的原因是暫時的,避免故障轉(zhuǎn)移所可能造成的潛在影響當(dāng)然是再好不過了。但是,由于無法知道這樣的節(jié)點還將沉默多長時間,故該節(jié)點可能遭受長時期的故障影響。因此,在經(jīng)過一個合理的時間段后就應(yīng)該啟動故障轉(zhuǎn)移過程。
.jpg)
2. 檢測資源故障
如果資源在當(dāng)前主機節(jié)點上是不可操作的而且不能重新啟動,則集群服務(wù)認(rèn)為此資源發(fā)生了故障。集群服務(wù)按以下方式檢測資源故障。
(1)在周期性的時間間隔內(nèi),集群服務(wù)檢查資源以了解資源是否可操作。集群服務(wù)通過定期調(diào)用資源監(jiān)視器來完成此項任務(wù)。反過來,資源監(jiān)視器則依賴于每個資源的資源主動態(tài)鏈接庫( DLL)執(zhí)行一段過程以檢測資源是否正常工作。資源 DLL 通過資源監(jiān)視器將結(jié)果傳給集群服務(wù)?梢酝ㄟ^設(shè)置“Looks Alive”和“ls Alive ,輪詢間隔來指定集群服務(wù)檢資資源故障的頻率。集群服務(wù)在每個“ls Alive ”時間間隔內(nèi)請求對資源 的狀態(tài)進行比“Looks Al ive" 間隔內(nèi)所傲的更徹底的檢查。“ls Alive”輪詢問隔通常比“Looks Alive”輪詢問隔長。
(2)如果資源 DLL 報告資源不可操作,那么集群服務(wù)會嘗試重新啟動資源?梢灾付悍⻊(wù)在一給定時間間隅內(nèi)嘗試重新啟動資源的次數(shù)如果集群服務(wù)在指定的時間向陸內(nèi)所做的嘗試的數(shù)量超過了最大重新啟動嘗試次數(shù),但是資源仍不可操作,那么集群服務(wù)會認(rèn)為資源出了故障。
可以配置是否故障資源引起包含該資源的組故障轉(zhuǎn)移到其他節(jié)點。如果故障資源配肯為引起包含該資源的組故障轉(zhuǎn)移到其他節(jié)點,那么集群服務(wù)將嘗試故障轉(zhuǎn)移。如果故障轉(zhuǎn)移嘗試次數(shù)坦過組的闕值而資源仍然處在故障狀態(tài),則集群服務(wù)將嘗試資源的重新啟動。在資源的“故障重試周期”屬性(所有資源的一個一般屬性)指定的周期結(jié)束后,將做重新啟動嘗試。集群服務(wù)開始對資源嘗試重新啟動然后故障轉(zhuǎn)移。
雖然“故障重試周期”屬性的單位是ms,但按分鐘順序選擇值。還可以選擇比資源重新啟動周期屬性值大的或者相等的值并強制執(zhí)行這個規(guī)則。
產(chǎn)品與服務(wù)
香港服務(wù)器 香港高防服務(wù)器 美國服務(wù)器 韓國服務(wù)器 新加坡服務(wù)器 日本服務(wù)器 臺灣服務(wù)器云服務(wù)器
香港云主機 美國云主機 韓國云主機 新加坡云主機 臺灣云主機 日本云主機 德國云主機 全球云主機高防專線
海外高防IP 海外無限防御 SSL證書 高防CDN套餐 全球節(jié)點定制 全球?qū)>GPLC關(guān)于我們
關(guān)于天下數(shù)據(jù) 數(shù)據(jù)招商加盟 天下數(shù)據(jù)合作伙伴 天下數(shù)據(jù)團隊建設(shè) 加入天下數(shù)據(jù) 媒體報道 榮譽資質(zhì) 付款方式關(guān)注我們
微信公眾賬號
新浪微博
天下數(shù)據(jù)手機站 關(guān)于天下數(shù)據(jù) 聯(lián)系我們 誠聘英才 付款方式 幫助中心 網(wǎng)站備案 解決方案 域名注冊 網(wǎng)站地圖
天下數(shù)據(jù)18年專注海外香港服務(wù)器、美國服務(wù)器、海外云主機、海外vps主機租用托管以及服務(wù)器解決方案-做天下最好的IDC服務(wù)商
《中華人民共和國增值電信業(yè)務(wù)經(jīng)營許可證》 ISP證:粵ICP備07026347號
朗信天下發(fā)展有限公司(控股)深圳市朗玥科技有限公司(運營)聯(lián)合版權(quán)
深圳總部:中國.深圳市南山區(qū)深圳國際創(chuàng)新谷6棟B座10層 香港總部:香港上環(huán)蘇杭街49-51號建安商業(yè)大廈7樓
7×24小時服務(wù)熱線:4006388808香港服務(wù)電話:+852 67031102
本網(wǎng)站的域名注冊業(yè)務(wù)代理北京新網(wǎng)數(shù)碼信息技術(shù)有限公司的產(chǎn)品