一,、現(xiàn)有硬件及應(yīng)用環(huán)境(已具備,,本次無需采購)
1.服務(wù)器兩臺(安裝操作系統(tǒng)且用于運行客戶的應(yīng)用服務(wù));
2.服務(wù)器的操作系統(tǒng):Windows NT Server,;
3.應(yīng)用服務(wù):Interlib(圖創(chuàng)圖書館集群化管理系統(tǒng))
二,、熱備方案應(yīng)達到的目的
本項目為解決基于存儲共享或者雙機鏡像的熱備軟件系統(tǒng)中存在的共享存儲設(shè)備單點故障問題,可建立異地存儲(容災(zāi))子系統(tǒng),,避免今后基礎(chǔ)設(shè)施的重建,,為下一步整合和擴大圖書館資源建設(shè)和服務(wù)提供保障,。
通過搭建純軟雙機的系統(tǒng)高可用性解決方案在兩臺服務(wù)器運行Oracle和Interlib,。使用兩臺服務(wù)器構(gòu)造高可用系統(tǒng),實現(xiàn)Oracle和Interlib應(yīng)用服務(wù)7*24運行,同時服務(wù)器之間數(shù)據(jù)實時鏡像,,保證數(shù)據(jù)的高可用性,。
1.兩臺服務(wù)器,每臺服務(wù)器都裝上Oracle數(shù)據(jù)庫,,Interlib應(yīng)用服務(wù),,并能夠單獨運行。
2.系統(tǒng)中相關(guān)的數(shù)據(jù)都存放在Oracle數(shù)據(jù)庫中,。
3. Interlib應(yīng)用服務(wù)對外提供服務(wù),,對應(yīng)于Tomcat配置多個活動IP。(注意的是配置的活動IP與服務(wù)器上的本地IP要在不同的網(wǎng)段上)
4.服務(wù)器之間用RS232串口或TCP/IP socket作為心跳線,,傳輸熱備軟件的心跳信息,。(建議用戶至少建立兩條心跳線,避免服務(wù)器間通信的單點故障)
5.服務(wù)器之間通過基于TCP/IP協(xié)議的網(wǎng)絡(luò)進行數(shù)據(jù)實時復(fù)制,。
熱備軟件將分別安裝在兩臺服務(wù)器上,其中一臺作為Interlib(圖書館自動化集群管理系統(tǒng))和Oracle數(shù)據(jù)庫兩個應(yīng)用服務(wù)的主服務(wù)器,,另外一臺作 為Interlib和Oracle數(shù)據(jù)庫的備服務(wù)器,雙機軟件在這兩臺服務(wù)器之間做虛擬公用ip以提供對外服務(wù),,正常情況下一臺服務(wù)器對外提供服務(wù) (Oracle作為后臺數(shù)據(jù)庫),,同時其服務(wù)變動的數(shù)據(jù)會實時傳遞到另外一臺主機上進行備份。一旦某個服務(wù)器上的服務(wù)出現(xiàn)故障,,另外一臺服務(wù)器便在不影響 自身的應(yīng)用服務(wù)的情況下接管其任務(wù),,直到故障服務(wù)器恢復(fù)為止。
三,、熱備軟件技術(shù)和方案要求
1.熱備軟件工作模式
軟件需支持Active/Standby和Active/Active兩種模式,。
2.保證業(yè)務(wù)的持續(xù)不間斷
正常情況下應(yīng)用服務(wù)(Interlib圖書館集群化管理系統(tǒng))在主服務(wù)器上運行,熱備軟件將主服務(wù)器的數(shù)據(jù)實時鏡像到備服務(wù)器上,,并實時監(jiān)控應(yīng)用,、網(wǎng)絡(luò)等 狀態(tài)。當(dāng)主服務(wù)器發(fā)生故障時,,熱備軟件會迅速地將應(yīng)用服務(wù)以及相關(guān)資源切換到備服務(wù)器上,,使用備服務(wù)器上的鏡像數(shù)據(jù)繼續(xù)運行應(yīng)用服務(wù),并持續(xù)對外提供服 務(wù),。
3.在線備份數(shù)據(jù)或維護
當(dāng)需要對備機上復(fù)制的數(shù)據(jù)進行備份,、查看的操作,不希望新的數(shù)據(jù)寫入時,,可以使備機暫停寫入,,暫停后數(shù)據(jù)仍將發(fā)送到備機,備機將暫停后的數(shù)據(jù)緩存起來,。備 機完成數(shù)據(jù)操作后,,再將緩存的數(shù)據(jù)寫入到備機磁盤中,,恢復(fù)正常操作狀態(tài),熱備軟件 允許對Active主機復(fù)制的數(shù)據(jù)暫停發(fā)送,,暫停后變化的數(shù)據(jù)仍將被截獲,,變化的數(shù)據(jù)將被存入source端pagefile中,等待傳輸暫?;謴?fù)后發(fā) 送,。
4.智能的故障處理恢復(fù)
在網(wǎng)絡(luò)故障、傳輸暫停等情況下,,數(shù)據(jù)無法發(fā)送時,,服務(wù)可將數(shù)據(jù)暫存在pagefile中,當(dāng)可以發(fā)送后繼續(xù)進行發(fā)送,,保證數(shù)據(jù)不會丟失,。pagefile 的大小可以自行設(shè)定。當(dāng)網(wǎng)絡(luò)發(fā)生故障后,,熱備軟件的數(shù)據(jù)復(fù)制不會停止,,而是將復(fù)制的數(shù)據(jù)放入pagefile中,當(dāng)網(wǎng)絡(luò)恢復(fù)后將自動地將pagefile 中的數(shù)據(jù)發(fā)送到目標機,,而不需要重新進行同步,,減少網(wǎng)絡(luò)和CPU的負載。
5.增強數(shù)據(jù)安全策略
熱備軟件提供全面的數(shù)據(jù)安全策略,,對數(shù)據(jù)的可用狀態(tài)進行監(jiān)控,,充分保證切換后的數(shù)據(jù)狀態(tài)是一致有效的。 熱備軟件完整的高可用性保護策略,,在主機發(fā)生故障時,,可以及時自動的將應(yīng)用服務(wù)切換到備機,確保業(yè)務(wù)迅速恢復(fù),。
6.數(shù)據(jù)冗余保護
熱備軟件監(jiān)控在主機上的應(yīng)用,。一旦捕獲到應(yīng)用變動的數(shù)據(jù),便立即把該數(shù)據(jù)鏡像到另外的主機中,,從而保證兩臺主機數(shù)據(jù)的一致性,,實現(xiàn)冗余保護。
7.消除備份窗口
通過備機寫入暫?;蛑鳈C傳輸暫停,,可以在確保主機應(yīng)用在線持續(xù)運行的情況下,通過備機將數(shù)據(jù)備份到帶庫上,。即保證了業(yè)務(wù)的持續(xù)運行,,性能不受影響,又可以 對數(shù)據(jù)進行更多方式,,更加靈活的備份保護,。同時備份操作的作業(yè)時間也有了更大的靈活性,,不必等到晚上或是周末再進行。
8.降低管理和維護成本
數(shù)據(jù)的實時鏡像和保證業(yè)務(wù)7*24提供服務(wù),,是熱備軟件自動完成,不需要人工進行干預(yù),。
9.實時對磁盤空間監(jiān)控
熱備軟件提供磁盤空間監(jiān)控功能,,當(dāng)磁盤的可用空間低于設(shè)定值時,將通過郵件,、在線消息進行報警,。
10.服務(wù)器錯誤郵件實時信息通知
熱備軟件支持郵件信息通知,當(dāng)發(fā)生異常情況時,,系統(tǒng)將自動地發(fā)送信息給設(shè)定的郵箱,,幫助管理員及時了解系統(tǒng)運行狀態(tài)。
11.與Interlib集群管理系統(tǒng)短信平臺無縫對接
熱備軟件除了支持郵件信息通知外,,還能與Interlib的短信平臺進行對接,,當(dāng)發(fā)生異常情況時,系統(tǒng)自動根據(jù)異常錯誤級別自動發(fā)送給指定的級別的管理操作人員,,幫助用戶實時了解服務(wù)器運行情況,。
12.按需復(fù)制性能資源最佳效果
熱備軟件支持復(fù)制數(shù)據(jù)集的定義,用戶可以選擇定制需要復(fù)制的目錄,、文件,。熱備軟件的數(shù)據(jù)鏡像是基于文件系統(tǒng)之上的,僅僅復(fù)制文件變化的部分,。熱備軟件通過 自身的驅(qū)動程序來監(jiān)控用戶指定數(shù)據(jù)集,,獲取變化內(nèi)容進行傳輸處理。以這種以字節(jié)為單位的按需復(fù)制,,充分保證系統(tǒng)性能和效率的最佳化,。
13.自動的應(yīng)用高可用性保護
熱備軟件中每個被保護的應(yīng)用可以建立8個活動IP,客戶端可以通過活動IP訪問應(yīng)用服務(wù),,另外熱備軟件中每個被保護的應(yīng)用都可以建立多個主機別名,,客戶端可以通過別名訪問應(yīng)用服務(wù)。
14.支持應(yīng)用進程的監(jiān)控
熱備軟件可以監(jiān)控標準的Windows服務(wù)或是Linux平臺的應(yīng)用,,同時支持以自定義方式對用戶自己的應(yīng)用進程進行監(jiān)控,。
15.實時網(wǎng)卡、活動IP的監(jiān)控
熱備軟件將對主機的網(wǎng)卡,、活動IP的狀態(tài)進行監(jiān)控,,當(dāng)發(fā)生故障時通過在線消息等進行通知。
16.支持多條心跳
熱備軟件支持Socket和RS232兩種類型的心跳,,并支持心跳冗余,,最多允許三條心跳,。當(dāng)配置遠距離的高可用性系統(tǒng)時,使用網(wǎng)卡類型的心跳,。
|