什么是服務(wù)器集群
服務(wù)器集群相對(duì)于單臺(tái)服務(wù)器,或者熱備份服務(wù)器系統(tǒng)來說都具有非常明顯的優(yōu)勢(shì)。同時(shí),它與其他服務(wù)器擴(kuò)展技術(shù)相比,比具有較強(qiáng)優(yōu)勢(shì)。如與廣泛的SMP技術(shù)相比,服務(wù)器集群技術(shù)更易于實(shí)現(xiàn),它開發(fā)周期短,而且造價(jià)低。雖然節(jié)點(diǎn)之間的數(shù)據(jù)傳輸?shù)乃俾时萐MP總線低,但是它的可擴(kuò)展性遠(yuǎn)遠(yuǎn)超過了SMP,在一個(gè)集群中可以輕松地支持256個(gè)以上的CPU。同時(shí),由于各節(jié)點(diǎn)之間使用了松散耦合的方式連接,可以在系統(tǒng)正在運(yùn)行的情況下方便地更換或添加節(jié)點(diǎn),因此它在這方面也優(yōu)于目前的SMP技術(shù)。綜合起來看,使用集群技術(shù)的好處主要有以下幾個(gè)方面。
(1)強(qiáng)擴(kuò)展能力
其他擴(kuò)展技術(shù),通常僅能支持幾十個(gè)CPU的擴(kuò)展,擴(kuò)展能力有限,而采用服務(wù)器集群技術(shù)的集群系統(tǒng)則可以擴(kuò)展到包括成百上千個(gè)CPU的多臺(tái)服務(wù)器,擴(kuò)展能力具有明顯優(yōu)勢(shì)。集群服務(wù)還可不斷進(jìn)行調(diào)整,以滿足不斷增長(zhǎng)的應(yīng)用要求,當(dāng)集群的整體負(fù)荷超過集群的實(shí)際能力時(shí),還可以添加額外的節(jié)點(diǎn)。
(2)實(shí)現(xiàn)方式容易
服務(wù)器集群技術(shù)相對(duì)其他擴(kuò)展技術(shù)來說更加容易實(shí)現(xiàn),主要是通過軟件進(jìn)行的。在硬件上可以把多臺(tái)性能較低、價(jià)格便宜的服務(wù)器,通過集群服務(wù)集中連接在一起即可實(shí)現(xiàn)整個(gè)服務(wù)器系統(tǒng)成
倍,甚至幾十、幾百倍地增長(zhǎng)。無論是從軟硬件構(gòu)成成本上來看,還是從技術(shù)實(shí)現(xiàn)成本上來看都較其他擴(kuò)展方式低。
(3)使用集群服務(wù)擁有整個(gè)集群系統(tǒng)資源的所有權(quán)。
如磁盤驅(qū)動(dòng)器和IP地址將自動(dòng)的從有故障的服務(wù)器上轉(zhuǎn)移到可用的服務(wù)器上。當(dāng)集群中系統(tǒng)或應(yīng)用程序出現(xiàn)故障時(shí),集群軟件將在可用的服務(wù)器上,重啟失效的應(yīng)用程序,或?qū)⑹Ч?jié)點(diǎn)上的工作分配到剩余的節(jié)點(diǎn)上。在切換過程中,用戶只是覺得服務(wù)暫時(shí)停頓了一下。
(4)易管理型
可以使用集群管理器來管理集群系統(tǒng)的所有服務(wù)器資源和應(yīng)用程序,像它們都運(yùn)行在同一個(gè)服務(wù)器上一樣??梢酝ㄟ^拖放集群對(duì)象,在集群里的不同服務(wù)器間移動(dòng)應(yīng)用程序,也可以通過同樣的方式移動(dòng)數(shù)據(jù),還可以通過這種方式來手工地平衡服務(wù)器負(fù)荷、卸載服務(wù)器,從而方便地進(jìn)行維護(hù)。同時(shí),還可以從網(wǎng)絡(luò)的任意地方的節(jié)點(diǎn)和資源處,監(jiān)視集群的狀態(tài)。當(dāng)失效的服務(wù)器連回來時(shí),將自動(dòng)返回工作狀態(tài),服務(wù)器集群技術(shù)將自動(dòng)在集群中平衡負(fù)荷,而不需要人工干預(yù)。
什么是容錯(cuò)服務(wù)器
容錯(cuò)服務(wù)器是基于容錯(cuò)技術(shù)的原理,采用硬件全冗余的技術(shù),在兩套硬件之間還通過獨(dú)立芯片和軟件保證故障時(shí)臨時(shí)切換的服務(wù)器。簡(jiǎn)單的說就是在服務(wù)器系統(tǒng)中出現(xiàn)數(shù)據(jù)或文件丟失及損壞時(shí),自動(dòng)恢復(fù)到損壞前的正常狀態(tài),確保服務(wù)器正常使用,用以體現(xiàn)服務(wù)器對(duì)錯(cuò)誤的容納能力。
服務(wù)器集群技術(shù)與容錯(cuò)服務(wù)器的區(qū)別
容錯(cuò)的含義比較寬泛,這種不確定性容易引發(fā)歧義,增加理解上的難度。從概念上來說,容錯(cuò)是指服務(wù)器對(duì)于錯(cuò)誤的容納能力,是應(yīng)用過程中對(duì)于服務(wù)器穩(wěn)定性追求的一個(gè)目標(biāo)。為了這樣一個(gè)目標(biāo),有幾種技術(shù)上的實(shí)現(xiàn)方法,目前國(guó)內(nèi)談?wù)撟疃嗟氖侨N:服務(wù)器群集技術(shù)、雙機(jī)冗余服務(wù)器方案和單機(jī)容錯(cuò)技術(shù)。
實(shí)際上,服務(wù)器群集和雙機(jī)冗余的技術(shù)比較類似,雙機(jī)冗余是最簡(jiǎn)單的集群,是其一個(gè)特例,也可以把服務(wù)器集群技術(shù)視為雙機(jī)冗余的延伸,可以理解為一種多機(jī)容錯(cuò)的方案。在一般的討論之中,集群技術(shù)是為了解決計(jì)算性能不足的問題,通過多臺(tái)服務(wù)器的集群計(jì)算,為高性能計(jì)算領(lǐng)域應(yīng)用提供所需要的高性能。采用集群技術(shù),通過多臺(tái)服務(wù)器之間的負(fù)載均衡,可以解決服務(wù)器單點(diǎn)故障所引發(fā)的系統(tǒng)不穩(wěn)定,提高系統(tǒng)的可靠性,因此集群具有更好的容錯(cuò)能力,但是在實(shí)際的應(yīng)用中,集群技術(shù)多用于高性能計(jì)算。