本文介紹如何利用Windows Server 2003軟件來搭建服務器集群。集群為資源和應用程序提供高可用性、故障恢復、可伸縮性和可管理性。
1、Microsoft Windows 2003集群介紹
服務器群集是一組協同工作并運行Microsoft群集服務(Microsoft Cluster Service,MSCS)的獨立服務器。服務器群集為資源和應用程序提供高可用性、故障恢復、可伸縮性和可管理性。
服務器群集允許客戶端在出現故障和計劃中的暫停時,依然能夠訪問應用程序和資源。如果群集中的某一臺服務器由于故障或維護需要而無法使用,資源和應用程序將轉移到可用的群集節點上。
Windows群集(Windows Clustering)解決方案使用了名詞“高可用性”而非“容錯”。容錯技術提供更高層次的彈性和恢復能力。容錯服務器通常使用深層硬件冗余,加上專門的軟件,幾乎可以即時地恢復任何單一的硬件或軟件錯誤。這些解決方案要比Windows群集(Windows Clustering)解決方案昂貴得多,因為組織必須為處于空閑狀態等待錯誤的冗余硬件支付費用。
服務器群集無法保證無間斷運作,但是確實能夠為多數關鍵任務應用程序提供足夠的可用性。群集服務可以對應用程序和資源進行監控,并能夠自動識別和恢復眾多故障狀況。這為在群集中管理工作負荷提供了靈活性。另外,還提高了整個系統的可用性。
群集服務(Cluster service)的優點包括:
• 高可用性:通過服務器群集,資源(例如:磁盤驅動器和Internet協議(IP)地址)的所有權會自動從故障服務器轉移到可用的服務器。當群集中的某個系統或應用程序發生故障時,群集軟件會在可用的服務器上重新啟動故障應用程序,或者將工作從故障節點分散到剩下的節點上。由此,用戶只在瞬間感覺到服務的暫停。
• 故障恢復:當故障服務器重新回到其預定的首選所有者的聯機狀態時,群集服務將自動在群集中重新分配工作負荷。該特性可配置,但默認禁用。
• 可管理性:您可以使用“群集管理器”工具(CluAdmin.exe),將群集作為一個單一的系統進行管理,并對猶如運行于一個單一服務器的應用程序實施管理。您可以將應用程序轉移到群集中的其它服務器。“群集管理器”可用于手動平衡服務器的工作負荷,并針對計劃維護釋放服務器。您還可以監控群集的狀態、所有節點以及來自網絡任何地方的資源。
• 可伸縮性:群集服務可擴展以滿足需求的增長。當群集監督應用程序的總體負荷超出了群集的能力范圍時,可以添加附加的節點。
本文檔提供有關針對連接到共享群集存儲設備并運行Server 2003 Enterprise Edition或Windows Server 2003的服務器創建和配置服務器群集的指導。本文檔的目的是為了指引您完成安裝典型群集的步驟,并未解釋如何安裝群集應用程序。而對于實施非傳統仲裁模型,如:多數節點集(Majority Node Set,MNS),的Windows群集(Windows Clustering)解決方案和地理位置分散的群集也不予以討論。關于服務器群集概念以及安裝和配置步驟的附加信息,請參見“Windows Server 2003在線幫助”。
服務器群集配置清單:
本清單幫助您進行安裝準備,其后接具體的步驟指導。
軟件要求
• 群集中的所有計算機均安裝了Microsoft Windows Server 2003 Enterprise Edition或Windows Server 2003 Datacenter Edition。
• 一個名稱解析法,比如:域名系統(Domain Name System,DNS)、DNS動態更新協議、Windows Internet名稱服務(Windows Internet Name Service,WINS)、HOSTS等等。
• 一個現有的域模型。
• 所有的節點必須是同一個域的成員。
• 一個域級帳戶,必須是每個節點上的本地管理員組的成員。建議采用專用帳戶。
硬件要求
• 群集硬件必須屬于群集服務硬件兼容性列表(Hardware Compatibility List,HCL)。要查找最新的群集服務硬件兼容性列表,請登陸位于http://www.microsoft.com/hcl/的Windows硬件兼容性列表(Windows Hardware Compatibility List),然后搜索“cluster”(群集)。整個解決方案必須得到HCL認證,而不僅僅是個別組件。附件信息,請在Microsoft知識庫(Microsoft Knowledge Base)中參閱下方文章:
309395 Microsoft對于服務器群集和硬件的支持策略(The Microsoft Support Policy for Server Clusters and the Hardware)
注意:如果您正在存儲區域網絡(SAN)上安裝該群集,并計劃讓多個設備和群集與之共享SAN,那么該解決方案也必須服從“群級/多群集設備(Cluster/Multi-Cluster Device)”硬件兼容性列表。附加信息,請在Microsoft知識庫中參閱下方文章:
304415 針對附加到相同SAN設備的多群集的支持(Support for Multiple Clusters Attached to the Same SAN Device)
• 兩個超大存儲設備控制器——小型計算機系統接口(Small Computer System Interface,SCSI)或光纖通道(Fibre Channel);一個用于在其中一個域控制器上安裝操作系統(OS)的本地系統磁盤;一個面向共享磁盤的獨立的外圍組件互連( PCI)存儲控制器。
• 群集中的每個節點擁有兩個PCI網絡適配器。
• 將共享存儲設備附加到所有計算機的存儲電纜。參考關于配置存儲設備的制造商指南。參見本文后面的附錄,了解有關使用SCSI或光纖通道(Fibre Channel)所需的特定配置。
• 對于所有的節點,一切硬件都必須是可識別的,對應正確的插槽、設備卡、BIOS、固件修訂版等等。這將使配置變得更加簡單,同時消除兼容性問題。
網絡要求
• 一個唯一的NetBIOS名稱。
• 每個節點上的所有網絡界面均擁有靜態IP地址。 注意:服務器群集(Server Clustering)不支持使用由動態主機配置協議(Dynamic Host Configuration Protocol,DHCP)服務器分配的地址。
• 接入一個域控制器。如果群集服務無法驗證用于啟動服務的用戶帳戶,可能導致群集發生故障。建議您在群集所在的相同的局域網(LAN)上擁有一個域控制器,以便確保其可用性。
• 每個節點至少必須擁有兩個網絡適配器——一個用于連接客戶端公用網絡,另一個用于連接節點對節點專用群集網絡。HCL認證要求一個專用網絡適配器。
• 所有節點都必須擁有兩個面向公用和專用通信的物理獨立的局域網(LAN)或虛擬局域網(LAN)。
• 如果您正在使用容錯網卡或網絡適配器組合,確認您正在使用最新的固件和驅動程序。向您的網絡適配器制造商核實群集兼容性。
共享磁盤要求
• 一個經HCL認可的連接到所有計算機的外部磁盤存儲單元。其將用作群集共享磁盤。建議采用某種類型的硬件獨立磁盤冗余陣列( RAID)。
• 所有共享磁盤,包括仲裁磁盤,必須在物理上附加到一個共享總線。
注意:以上要求并不適用于多數節點集( Majority Node Set,MNS)群集。這類群集本指南不予討論。
• 共享磁盤必須位于系統驅動器所用的控制器以外的另一個控制器上。
• 建議在RAID配置中創建多個硬件級別的邏輯驅動器,而不是使用一個單一的邏輯磁盤,然后將其分成多個操作系統級別的分區。這不同于獨立服務器通常所采用的配置。但是,它使您可以在群集中擁有多個磁盤資源,并跨節點執行“活動/活動(Active/Active)”配置和手動負載平衡。
• 最小50兆字節(MB)的專用磁盤用作仲裁設備。為了得到最佳的NTFS文件系統性能,建議采用最小500 MB的磁盤分區。
• 確認可以從所有的節點看到附加到共享總線的磁盤。這可以在主適配器安裝中進行查看。請參考制造商的文檔,了解適配器指定的指導說明。
• 必須根據制造商的指導說明,對SCSI設備分配唯一的SCSI標識號,并正確地將其端接。參見本文附錄,了解有關安裝和端接SCSI設備的信息。
• 所有共享磁盤必須配置為基本磁盤。附加信息,請在Microsoft知識庫中參閱下方文章:
237853 服務器群集磁盤資源不可用的動態磁盤配置(Dynamic Disk Configuration Unavailable for Server Cluster Disk Resources)
群集共享磁盤不支持軟件容錯。
• 在運行64位版本的Windows Server 2003的系統上,所有共享磁盤必須配置為主引導記錄(MBR)。
• 群集磁盤上的所有分區必須格式化為NTFS。
• 建議所有磁盤均采用硬件容錯RAID配置。
• 建議最少采用兩個邏輯共享驅動器。