雙機(jī)熱備針對(duì)的是服務(wù)器的臨時(shí)故障所做的一種備份技術(shù),通過(guò)雙機(jī)熱備,來(lái)避免長(zhǎng)時(shí)間的服務(wù)中斷,保證系統(tǒng)長(zhǎng)期、可靠的服務(wù)。今天,服務(wù)器解決方案專家天下數(shù)據(jù)將為大家詳細(xì)介紹雙機(jī)熱備份解決方案。
1.雙機(jī)熱備介紹 集群(Cluster)技術(shù)是指一組相互獨(dú)立的計(jì)算機(jī),利用高速通信網(wǎng)絡(luò)組成一個(gè)計(jì)算機(jī)系統(tǒng),每個(gè)群集節(jié)點(diǎn)(即集群中的每臺(tái)計(jì)算機(jī))都是運(yùn)行其自己進(jìn)程的一個(gè)獨(dú)立服務(wù)器。一個(gè)集群包含多臺(tái)擁有共享數(shù)據(jù)存儲(chǔ)空間的服務(wù)器,各服務(wù)器通過(guò)內(nèi)部局域網(wǎng)相互通信。當(dāng)一個(gè)節(jié)點(diǎn)發(fā)生故障時(shí),它所運(yùn)行的應(yīng)用程序?qū)⒂善渌?jié)點(diǎn)自動(dòng)接管。
其中,只有兩個(gè)節(jié)點(diǎn)的高可用集群又稱為雙機(jī)熱備,即使用兩臺(tái)服務(wù)器互相備份。當(dāng)一臺(tái)服務(wù)器出現(xiàn)故障時(shí),可由另一臺(tái)服務(wù)器承擔(dān)服務(wù)任務(wù),從而在不需要人工干預(yù)的情況下,自動(dòng)保證系統(tǒng)能持續(xù)對(duì)外提供服務(wù)。
2. 雙機(jī)熱備適用對(duì)象 一般郵件服務(wù)器是要長(zhǎng)年累月工作的,且為了工作上需要,其郵件備份工作就絕對(duì)少不了。有些企業(yè)為了避免服務(wù)器故障產(chǎn)生數(shù)據(jù)丟失等現(xiàn)象,都會(huì)采用RAID技術(shù)和數(shù)據(jù)備份技術(shù)。但是數(shù)據(jù)備份只能解決系統(tǒng)出現(xiàn)問(wèn)題后的恢復(fù);而RAID技術(shù),又只能解決硬盤(pán)的問(wèn)題。我們知道,無(wú)論是硬件還是軟件問(wèn)題,都會(huì)造成郵件服務(wù)的中斷,而RAID及數(shù)據(jù)備份技術(shù)恰恰就不能解決避免服務(wù)中斷的問(wèn)題。
要恢復(fù)服務(wù)器,再輕微的問(wèn)題或者強(qiáng)悍的技術(shù)支持,服務(wù)器都要中斷一段時(shí)間,對(duì)于一些需要隨時(shí)實(shí)時(shí)在線的用戶而言,丟失郵件就等于丟失金錢(qián),損失可大可小,這類用戶是很難忍受服務(wù)中斷的。因此,就需要通過(guò)雙機(jī)熱備,來(lái)避免長(zhǎng)時(shí)間的服務(wù)中斷,保證系統(tǒng)長(zhǎng)期、可靠的服務(wù)。
3. 實(shí)現(xiàn)方案 雙機(jī)熱備有兩種實(shí)現(xiàn)模式,一種是基于共享的存儲(chǔ)設(shè)備的方式,另一種是沒(méi)有共享的存儲(chǔ)設(shè)備的方式,一般稱為純軟件方式。 1)基于共享的存儲(chǔ)設(shè)備的方式
 基于存儲(chǔ)共享的雙機(jī)熱備是雙機(jī)熱備的最標(biāo)準(zhǔn)方案。對(duì)于這種方式,采用兩臺(tái)服務(wù)器(郵件系統(tǒng)同時(shí)運(yùn)行在兩臺(tái)服務(wù)器上),使用共享的存儲(chǔ)設(shè)備磁盤(pán)陣列(郵件系統(tǒng)的數(shù)據(jù)都存放在該磁盤(pán)陣列中)。兩臺(tái)服務(wù)器可以采用互備、主從、并行等不同的方式。在工作過(guò)程中,兩臺(tái)服務(wù)器將以一個(gè)虛擬的IP地址對(duì)外提供服務(wù),依工作方式的不同,將服務(wù)請(qǐng)求發(fā)送給其中一臺(tái)服務(wù)器承擔(dān)。同時(shí),服務(wù)器通過(guò)心跳線(目前往往采用建立私有網(wǎng)絡(luò)的方式)偵測(cè)另一臺(tái)服務(wù)器的工作狀況。當(dāng)一臺(tái)服務(wù)器出現(xiàn)故障時(shí),另一臺(tái)服務(wù)器根據(jù)心跳偵測(cè)的情況做出判斷,并進(jìn)行切換,接管服務(wù)。對(duì)于用戶而言,這一過(guò)程是全自動(dòng)的,在很短時(shí)間內(nèi)完成,從而對(duì)業(yè)務(wù)不會(huì)造成影響。由于使用共享的存儲(chǔ)設(shè)備,因此兩臺(tái)服務(wù)器使用的實(shí)際上是一樣的數(shù)據(jù),由雙機(jī)或集群軟件對(duì)其進(jìn)行管理。
優(yōu)點(diǎn):對(duì)于共享方式,數(shù)據(jù)庫(kù)放在共享的存儲(chǔ)設(shè)備上。當(dāng)一臺(tái)服務(wù)器提供服務(wù)時(shí),直接在存儲(chǔ)設(shè)備上進(jìn)行讀寫(xiě)。而當(dāng)系統(tǒng)切換后,另一臺(tái)服務(wù)器也同樣讀取該存儲(chǔ)設(shè)備上的數(shù)據(jù)。它可以在無(wú)人值守的情況下提供快速的切換,保證不會(huì)有數(shù)據(jù)丟失現(xiàn)象。 缺點(diǎn):增加了昂貴的存儲(chǔ)設(shè)備投資,對(duì)于有實(shí)力的企業(yè),可優(yōu)先考慮該方式。
2)純軟件方式
 純軟件的方式,通過(guò)鏡像軟件,將數(shù)據(jù)可以實(shí)時(shí)復(fù)制到另一臺(tái)服務(wù)器上,這樣同樣的數(shù)據(jù)就在兩臺(tái)服務(wù)器上各存在一份,如果一臺(tái)服務(wù)器出現(xiàn)故障,可以及時(shí)切換到另一臺(tái)服務(wù)器。
優(yōu)點(diǎn): a.避免了磁盤(pán)陣列的單點(diǎn)故障:對(duì)于雙機(jī)熱備,本身即是防范由于單個(gè)設(shè)備的故障導(dǎo)致服務(wù)中斷,但磁盤(pán)陣列恰恰又形成了一個(gè)新的單點(diǎn)。(比如,服務(wù)器的可靠系數(shù)是99.9%, 磁盤(pán)陣列的可靠系數(shù)是99.95%,則純軟雙機(jī)的可靠系數(shù)是1-99.9%x99.9%=99.99%,而基于磁盤(pán)陣列的雙機(jī)熱備系統(tǒng)的可靠系數(shù)則會(huì)是略低于99.95%
b.節(jié)約投資:不需購(gòu)買(mǎi)昂貴的磁盤(pán)陣列。 c.不受距離的限制:兩臺(tái)服務(wù)器不需受SCSI電纜的長(zhǎng)度限制(光纖通道的磁盤(pán)陣列也不受距離限制,但投資會(huì)大得多)。這樣,可以更靈活地部署服務(wù)器,包括通過(guò)物理位置的距離來(lái)提高安全性。
缺點(diǎn): a.可靠性相對(duì)較差,兩服務(wù)器間的數(shù)據(jù)實(shí)時(shí)復(fù)制是一個(gè)比較脆弱的環(huán)節(jié)。
b.一旦某臺(tái)服務(wù)器出現(xiàn)中斷,恢復(fù)后還要進(jìn)行比較復(fù)雜的數(shù)據(jù)同步恢復(fù)。并且,這個(gè)時(shí)段系統(tǒng)處于無(wú)保護(hù)狀態(tài)。
c.沒(méi)有事務(wù)機(jī)制,由于其復(fù)制是在文件和磁盤(pán)層進(jìn)行的,復(fù)制是否成功不會(huì)影響數(shù)據(jù)庫(kù)事務(wù)操作,因此有出現(xiàn)數(shù)據(jù)不完整變化的情況,這個(gè)存在著相當(dāng)?shù)娘L(fēng)險(xiǎn)。
4. 配置 硬件:兩臺(tái)相同配置的服務(wù)器,具體的要求大家可以根據(jù)各自的實(shí)際需要來(lái)選擇。
磁盤(pán)陣列,適用于采用共享的方式搭建雙機(jī)熱備系統(tǒng)。
集群軟件: 搭建雙機(jī)熱備當(dāng)然少不了集群軟件。在這里推薦集群軟件heartbeat,這個(gè)軟件包括心跳監(jiān)測(cè)部分和資源接管部分,心跳監(jiān)測(cè)可以通過(guò)網(wǎng)絡(luò)鏈路和串口進(jìn)行,而且支持冗余鏈路,它們之間相互發(fā)送報(bào)文來(lái)告訴對(duì)方自己當(dāng)前的狀態(tài),如果在指定的時(shí)間內(nèi)未收到對(duì)方發(fā)送的報(bào)文,那么就認(rèn)為對(duì)方失效,這時(shí)需啟動(dòng)資源接管模塊來(lái)接管運(yùn)行在對(duì)方主機(jī)上的資源或者服務(wù)。 雙機(jī)熱備配置 一、服務(wù)器2臺(tái)+2張HBA卡 服務(wù)器的配置盡量保持一致,起碼應(yīng)該保證主服務(wù)器的配置。 兩臺(tái)服務(wù)器的操作系統(tǒng)必須一致。 HBA卡的接口根據(jù)存儲(chǔ)的接口來(lái)定,有光纖接口和SAS接口兩種。
二、存儲(chǔ)陣列柜一臺(tái) SAS接口或者光纖接口 單控制器或者雙控制器
三、雙機(jī)容錯(cuò)軟件 系統(tǒng)自帶,如微軟windows2003 的MSCS等。 第三方雙機(jī)群集軟件,如ROSE HA, LanderCluster集群軟件等 注:有些系統(tǒng)服務(wù)器要求可能不止2臺(tái),比如微軟的windowsserver 2008做雙機(jī)熱備需要額外的服務(wù)器做與控制。
|