
證券是個“高壓”行業,IT人員一次操作失誤可能帶來系統100%的出錯幾率,其后果嚴重性也與其他行業相比被放大無數倍。如何將人為誤操作導致的系統故障率降至最低,如何減少IT運維人員的無效率工作,如何用最少的資源提供最多的服務, ITIL為IT運營勾勒了一幅完美遠景。
正因如此,首創證券技術總監伏勁松2003年就開始ITIL的研究,通過團隊組織學習吸收ITIL概念,經歷過理論與實踐的碰撞,遭遇了CMDB架構的裹足不前,再到轉投IT自動化懷抱。伏勁松對ITIL的落地實踐自有體會,并基于首創公司系統現狀,與第三方企業合作開發了一套證券公司IT自動化運營管理系統。
為了分享平臺建設經驗,探索IT自動化運營在證券業的現實意義,記者采訪了首創證券技術總監伏勁松。
重新認識ITIL IT自動化是ITIL的高級階段
說到首創證券的IT自動化運營管理系統,不得不提到一個20年前就很熱門的概念——ITIL,這個概念也是最初首創證券CIO伏勁松探索IT運營管理的切入點。
2003年,伏勁松就帶領公司IT團隊開始學習、消化ITIL理念。“我們碰到的第一個棘手問題就是CMDB(Configuration Management Database,配置管理數據庫)的構建。創建時需要收集哪些信息?哪些信息是我們必須的?如何滿足配置項屬性的‘精而不多’原則,為此我們部門開會討論不下10次,耗費了很多心力。”談及此,伏勁松一臉無奈。
其實,企業在實施ITIL項目的時候,配置管理常常被視為項目的“雞肋”——食之無味,棄之可惜。耗費大量人力和時間收集上來的各類IT基礎架構信息最后卻成為一個包袱——一個及其復雜而難以維護的“IT基礎架構信息庫”。
被CMDB構建牽扯不少精力的同時,2004年,首創證券開始陸續上線監控系統——防火墻監控系統、流量分析監控系統、網管監控系統等。“我們一邊搭建系統,一邊嘗試在ITIL這條路上繼續摸索。”伏勁松坦言。
將網管系統打造成一個集成監控系統,伏勁松也曾有過這個想法。“但這種做法在證券公司缺乏現實基礎。首先,不同監控系統的供應商之間存在技術壁壘;其次,國際主流廠商的產品已經標準化,無法提供適合我們公司IT環境的產品;再次,國內的相關廠商也是魚龍混雜。因此,集成網管系統這條路行不通。”
如果說ITIL項目實施和集成網管系統這兩條路遇阻礙,最終促成了首創證券IT運營管理系統建設的另辟蹊徑,那么,IT自動化技術則為后來的平臺搭建工作提供了一個堅實基礎。
“在真正了解IT自動化之后回過頭看ITIL,我覺得ITIL存在兩個問題:其一,ITIL看上去似乎很完美,但實施周期太長,流程繁瑣,而我們面臨的是要快速解決工作中所面臨的實際問題;其二,ITIL回避的一個關鍵問題——人,它默認人能夠正確執行ITIL所描述的規定流程,但實際工作中這需要很長的時間去磨合。證券公司經常進行應急演練規避各種風險,而一旦問題產生,在強壓之下人的動作難免不會變形。要讓所有流程都能穩定準確地執行,只能交給機器去做,也就是IT自動化。”伏勁松道:“IT自動化是ITIL的高級階段,它已經做得比ITIL更好了,我覺得可以把ITIL丟掉。”
感觸IT系統健康狀況的神經中樞
認準了IT自動化這條路,首創證券開始系統規劃實施。
證券公司的IT環境有其特殊性,與交易所、銀行以及分支機構的系統接口都有差異,證券公司自身幾乎沒有太多話語權。標準的不統一讓整合工作變得十分必要也使之成為不少企業信息化建設過程中難以跨越的一個關鍵點。
從首創系統當時的系統現狀來看,防火墻監控系統、流量分析系統、網管系統等多個系統各成一脈,對應了多個“處理中心”。這樣導致的后果是信息相互孤立,當問題發生時無法準確進行定位。
“對證券公司而言,系統安全穩定是運維工作的首要重點,但運維人員長期處于高壓力環境下工作,工作內容又瑣碎繁多、重復性強,很容易形成疲沓工作狀態,導致人為操作差錯出現。我們目前的多個系統使我們管理的對象,監控系統就是一個感知應用系統健康狀況的神經系統。但是如何高效地獲得系統各種信息,我們就把這些監控系統集成到一個平臺上,讓平臺成為我們系統的神經中樞。通過這個神經中樞,我們能夠更準確地感觸整個系統各個環節上的健康狀況。”
據伏勁松介紹,首創證券IT運營管理系統由三大組成部分組成,第一部分是監控系統,通過一個平臺實現多種監控信息的收集、聚合、關聯;第二部分是處理流程,我們建立規則庫對問題的處理設定一個處理流程;第三部分就是根據流程操作執行,我們也把它們集成到了一個平臺上。
規則庫的建立不可回避,這也就回到了當初ITIL實施中面臨的問題——如何創建CMDB。
伏勁松介紹說:“我們創建CMDB的方式比較有特色,通過把配置信息換成腳本,我們使CMDB能夠面向整個系統,這樣會很靈活。而且,這種做法也不會耗費我們很多時間,可以使我們把精力放在解決問題上。當我們發現某個問題而CMDB上沒有相對應的配置信息時,我們只需要更新并重新發布一下腳本即可。”
據伏勁松介紹,在對IT運營管理系統進行優化的過程中,他會考慮將IT自動化作為一種運營工具,形成對意外事件應對解決的一個學習機制。通過IT自動化來研究如何有效地分析采集信息,定位問題。
解放人力和資源 讓系統更安全
如果計算機事故70%是由人為差錯造成這種說法成立,那么引入IT自動化,對IT運營工作而言帶來的最大好處是系統安全性得到了提升。 “舉個例子,目前應對容量預警問題,我們可以迅速地定位問題原因,有效解決。”如伏勁松所言,基于IT自動化運營管理平臺,IT運維工作更為輕松。
“另一方面,IT自動化也是對人力資源的充分解放。目前公司的日常IT運營、運維工作總共只有三個人來承擔,能夠將另一部分員工的時間釋放出來,聚焦在技術架構、合規管理、項目管理等更高層次的工作上,同時,也能夠讓我們有足夠的人力來更深層次地優化既有IT自動化運營平臺和整個IT架構。”伏勁松介紹道。
證券IT運維工作需要操作人員強烈的責任心。即便個人的失誤概率很低,但是因為系統的復雜性是呈幾何級數方式增長,需要關注的地方太多,在向超出人所能及的方向快速發展,哪怕是一次失誤,也有可能帶來100%的出錯幾率。在證券公司,每個交易日開市前都需要進行系統檢查,這一過程中一旦產生人為疏忽導致的系統故障,在高壓力狀況下,就很難迅速對故障產生原因進行定位和排除。而自動化解決方案可以確保幾乎是百分之百的精確度,可以使重復操作的成本降低到很小。
對管理者而言,IT自動化運營管理系統建成后,伏勁松能夠帶著它的團隊輕裝前行,對業務變化的反應也能更為敏銳。與此同時,對系統的優化也在不斷進行中。“我們的終極目標是讓系統變得更智能,實現徹底無人值守。”
“如果我們能夠讓IT自動化成為一種運營工具,如果IT自動化系統變得足夠智能,我們可以在閉市后,在與交易所以及第三方托管銀行沒有數據傳輸需求時,將很多設備關掉。另外,公司業務的后臺支持設備也可以關閉。這樣,我們至少可以為公司節約50%的電能耗。”伏勁松說。
完善的流程與正確的技術、人的進步以及成本平衡因素等相互結合,無疑會產生高效率的優質服務。當然,在伏勁松看來,系統需要持續優化,未來,還有很多工作要做。
精彩觀點:做IT自動化是自己解放自己
IT自動化是對自己的解放。一些機械化的重復的工作應該交給機器去做,這樣人就能輕裝前進,并從更高的層面幫助企業IT系統的進化、完善。
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄