
DR(Disaster Recovery)系統(tǒng)容災(zāi)和BC(Business Continuity)業(yè)務(wù)連續(xù)性解決方案是業(yè)界基礎(chǔ)架構(gòu)Infrastructure方面的一個主要解決方案,各大存儲硬件和軟件公司都有自己的解決方案,總的來說,分為基于存儲、服務(wù)器、以及軟件應(yīng)用三種方式或者相互組合。因為通常來說,容災(zāi)解決方案都會在業(yè)務(wù)系統(tǒng)已經(jīng)投入運行一段時間后,由于重要性的不斷增加才提上日程,所以建設(shè)一個容災(zāi)系統(tǒng)必須完善地考慮對現(xiàn)有系統(tǒng)的綜合影響,仔細設(shè)計,否則會產(chǎn)生各種各樣的麻煩和困難。下面就和大家分享一個真實的案例。
客戶是一家在全球芯片行業(yè)排名靠前的外資企業(yè),在中國擁有200mm和300mm兩條生產(chǎn)線,每條生產(chǎn)線都有自己的MES(制造執(zhí)行系統(tǒng))系統(tǒng)。其中數(shù)據(jù)庫MESDB是重中之重,采用Oracle RAC來實現(xiàn)高可靠性,跑在兩臺滿配的HP rp7640上,后升級到rp8640,存儲系統(tǒng)也采取了HP高端的XP12000。每個系統(tǒng)的兩臺主機通過自己的SAN連接到自己的XP12000上,兩臺XP12000通過CA(continuous access,類似EMC的SRDF)軟件同步對方的MESDB數(shù)據(jù)庫,防范萬一XP12000故障,數(shù)據(jù)不丟失。系統(tǒng)架構(gòu)圖如下:

由于是芯片企業(yè),系統(tǒng)可靠性是第一位的,一旦停機損失慘重(每小時的損失高達100萬美金,主要是停產(chǎn)的產(chǎn)品銷售額和高昂機器設(shè)備的折舊),所以在IT系統(tǒng)上是非常舍得投入的。雖然采用了RAC,但負載全部集中在其中一臺機器上,采購兩臺一樣配置的機器加RAC就是為了在down機時,能零時間切換到另外一臺機器上。
從上圖可以看出,200mm和300mm的MES系統(tǒng)互相隔離,兩個SAN也沒有連接起來。客戶的應(yīng)用部門認為,萬一300mm的存儲XP12000壞掉,雖然在200mm的XP12000系統(tǒng)上仍然有數(shù)據(jù),但是應(yīng)用并不能自動切換來訪問,所以提出了系統(tǒng)容災(zāi)的項目。由于系統(tǒng)大部分是HP的,當(dāng)然HP被邀請?zhí)峤唤鉀Q方案。另外客戶在其他的系統(tǒng)上還使用了EMC的Symmetrix,有競爭才能獲得更好的價格,同時EMC也對這樣一個大客戶虎視眈眈,所以EMC也參與了方案提交。最后總共提交了三個方案:
方案 1:HP Campuscluster + RAC
方案 2:HP Metrocluster+CA
方案 3:Oracle data guard
方案 3
CIO頻道人物視窗
CIO頻道方案案例庫
大數(shù)據(jù)建設(shè)方案案例庫
電子政務(wù)建設(shè)方案案例庫
互聯(lián)集成系統(tǒng)構(gòu)建方案案例庫
商務(wù)智能建設(shè)方案案例庫
系統(tǒng)集成類軟件信息研發(fā)企業(yè)名錄