基層央行業務網超融合平臺探索

時間:2022-07-16 11:51:20

導語:基層央行業務網超融合平臺探索一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

基層央行業務網超融合平臺探索

摘要:業務網超融合平臺是人民銀行邵陽市中心支行解決信息系統“孤島式的建設和應用模式”的重要舉措,是信息系統虛擬化建設道路上一個非常重要的嘗試。本文介紹了該平臺的建設、完善過程和主要做法,并對實際運維情況進行小結。

關鍵詞:金融科技;超融合平臺;運維

一、引言

當前,人民銀行信息化建設發展迅速,但基層央行在系統的上線及運維方面,一直以來都存在“孤島式”的建設和應用弊端,存在建設周期長、資源利用率低等問題,數據的安全性及工作效率有待提高。中國人民銀行邵陽市中心支行(以下簡稱“人行邵陽中支”)為了解決弊端,積極探索虛擬化建設,于2017年11月初立項建設業務網超融合平臺,2018年1月18日正式上線。在實際運行過程中,該行不斷總結、不斷探索,先后進行了2次升級(一次平臺架構升級、一次網絡結構升級),逐步完善平臺,最終圓滿達成了建設目標。

二、探索背景

(一)平臺拓撲簡單,風險抵御能力不足。在平臺建設初期,人行邵陽中支決定整個平臺的建設分多步進行,首期升級原有閑置服務器的硬件配置,在此基礎上搭建一個雙節點超融合架構平臺,今后再根據需要逐步升級平臺。初期的拓撲如圖1所示。初期平臺上創建了服務器網段、安全設備網段、測試網段等3個虛網,遷移了公文流轉、TIPS前置系統,邵陽金信港、邵陽電子設備管理系統,遠程培訓課程分發子系統主機、遠程培訓課程分發子系統主機和備機等6個在用應用系統,后期又創建了6個用于測試的云盤系統虛擬機。平臺CPU、內存、存儲資源充足,完全能滿足所有虛擬機運行及數據實時備份的需求。但是在雙節點架構運行時,一旦其中一個節點故障,在故障節點修復前平臺的運行壓力將急劇增加,可能影響某些部署在平臺上的系統的流暢性。同時,還將暫時出現單點風險。(二)局域網拓撲過時,效率及安全性有待提升。一是從平臺拓撲結構及局域網拓撲結構上來看,業務出口分別用千兆雙絞線與兩臺核心交換機相連。實際上,由于兩臺核心交換機通過傳統“MSTP+VRRP”架構進行組網連接,平臺兩條業務出口線路中有一條處于阻斷狀態,其網絡利用率最多只能達到50%。局域網拓撲亟待優化,平臺入網連接方式有待改進。中心網絡的可靠性及轉發能力亟待提高。二是從網絡管理層面來看,平臺上線后,業務網的業務系統、平臺軟件等全部部署在同一個虛網內(服務器虛網),無法做到對平臺訪問控制的最小權限配置,不便于對服務器進行分類管理及精細化訪問控制,存在一定的風險隱患。(三)運維不夠深入,平臺功能有待深挖。平臺上線后,人行邵陽中支組織力量平穩地將現行的業務系統逐一遷入平臺,實現了業務系統的實時備份。管理員每天巡檢平臺實體機的工作狀態,登錄平臺查看虛擬機的狀態,并在業務系統維護前保存快照。監控和運維手段比較單一,未能完全發揮出超融合平臺的智能化功能。

三、主要做法

(一)升級平臺架構,提升平臺健壯性。為了解決平臺風險抵御能力不足的隱患,并擴充平臺的存儲空間,人行邵陽中支新購入了一臺服務器,把平臺升級到3節點架構。新的架構充分考慮冗余設計,提升了平臺的容錯能力,如極大地降低了平臺在硬件和線路兩個方面的單點隱患。硬件方面,由于服務器數量增加到3臺,在一臺實體機故障宕機的情況下,平臺完全有能力支撐目前的所有業務正常運行,為故障機器的維修恢復提供了充足的時間。線路方面,平臺的業務出口和存儲通信均采用冗余連接。每臺服務器分別分配2個業務端口連接至2臺核心交換機,2個存儲通信端口連接至2臺存儲通信交換機,其中任何一條線路或交換機故障均不會影響平臺的正常運行。由于服務器端口資源有限,管理端口和VXLAN通信端口暫時不做冗余連接。平臺升級后的拓撲如圖2所示。(二)優化網絡結構,拓展平臺高效性。為了從網絡層面上拓展平臺的高效性,人行邵陽中支對業務網核心交換機進行了虛擬化升級。經過充分的市場調研及可行性驗證,在現網設備上增加了兩塊堆疊板卡和兩塊萬兆業務板卡,通過堆疊板卡組建CSS系統,實現了核心交換機虛擬化。接下來,人行邵陽中支將原有的平臺實體機與核心交換機之間的所有連線進行了聚合,實現了業務出口的負載均衡。這樣,在擴容網絡效率的同時,保護了已有投入,同時簡化了設備的配置和管理,提高了系統的可靠性。因此,網絡利用率、切換速度等方面都有了大幅度提升。核心交換機虛擬化升級后平臺的拓撲如圖3所示(三)細化網絡管理,提高平臺安全性。根據人行邵陽中支局域網IP地址的應用現狀及今后虛擬化建設的發展需求,該行將服務器生產區劃分為應用服務器、平臺服務器、存儲服務器、特殊服務器等4個虛網。其中,原服務器網段變更為應用服務器網段。應用服務器子網段主要部署對外提供服務的應用系統(如當前在用的所有應用系統),平臺服務器子網主要部署超融合平臺服務器,存儲服務器主要部署網絡存儲服務器(比如云盤系統、FTP服務器等),特殊服務器主要部署今后新上線的對訪問控制較為嚴格的應用服務器。虛網調整完成后,將平臺從應用服務器子網段遷移到了平臺服務器子網,并對平臺服務器子網設置了嚴格的訪問控制,只允許本地網管人員及系統管理員的IP訪問,極大地提高了平臺的安全性。(四)挖掘平臺功能,增強運維便捷性。平臺上線后,業務網內除上級托管在機房的4臺設備外,其他業務網應用服務器已基本遷移到平臺上,且今后上線的新系統也將部署在平臺上,平臺實際上已經成為服務器生產區。因此,如何充分發揮平臺的效用,提升運維便捷性,值得人行邵陽中支認真思考。1.虛擬機外部備份。上線初期,平臺的虛擬機備份均位于平臺本地,一旦平臺出現崩潰式故障,就會存在丟失所有數據的風險。基于將虛擬機備份獨立于平臺之外的思路,人行邵陽中支咨詢廠家,找到了平臺虛擬機外部備份的方法。平臺是通過創建備份池來存放備份數據的,而備份池的位置可以選擇本地或Windows共享目錄,還可以通過iSCSI服務擴展虛擬存儲。其中,Windows共享目錄和iSCSI服務擴展虛擬存儲的方式可以將虛擬機備份到外部。兩種方式對比而言,iSCSI服務擴展虛擬存儲安全性更高,但需要提供支持iSCSI服務協議的外部設備??紤]到實際情況,在不增加投入的前提下,人行邵陽中支選擇采用Windows共享的方式,將平臺虛擬機備份到安裝了Windowsserver2008系統的閑置服務器上。為了提高備份服務器的安全性,將備份服務器部署在平臺服務器子網并設置了嚴格的訪問策略,只允許平臺服務器訪問該備份服務器。外部備份配置完成后,平臺每天23:00開始將虛擬機自動備份到備份服務器,提高了數據安全性。2.啟用平臺監控。登錄平臺后,在首頁可以看到一些簡單的平臺運行數據,方便值班人員及時了解平臺的運行情況。但該界面內容過于簡單,值班人員如果需要了解各虛擬機的詳細運行情況,需要進入不同的模塊調閱,往往層級還比較深,操作比較復雜,反應時間比較長。有的甚至需要從系統管理員處獲得授權才能進入應用系統,增加了值班人員巡檢的難度。為了使日常巡檢變得更加方便快捷,人行邵陽中支啟用了平臺的監控中心功能。監控中心界面布局大方,科技感強,更直觀地展示當前各業務系統的運行狀況、資源占用情況、告警情況等,更能一鍵進入虛擬機詳情界面,全面、直觀地展現虛擬機實時狀況。監控中心的啟用,大大地提高了值班人員的工作效率。3.平臺故障通知。平臺具備了強大的故障監控功能,當平臺發生諸如網絡異常(如某個端口掉線)、資源不足(如某個虛擬機內存不足)、操作失?。ㄈ鐐浞菔。┑裙收蠒r,均會產生告警記錄。告警信息會及時在平臺首頁顯示,使值班人員巡檢時能及時發現。然而人行邵陽中支并不滿足于登錄系統發現告警,而更希望告警信息能實時通過其他方式通知運維人員。通過查詢平臺白皮書及咨詢廠商發現,系統本身自帶郵件通知功能。該功能配置完成并啟用后,平臺可以將告警信息實時發送到目的郵箱,在及時通告告警信息的同時擴大了告警信息的獲知群體(由單一值班人員擴展到全科人員),提高了平臺故障處理的時效性。(五)制訂平臺制度,強化運維規范性。在日常運維方面,人行邵陽中支堅決落實上級行“三道防線”的要求,積極推動平臺在運行維護、風險控制、安全審計全方位落實到位。系統試運行后,其先后制定了《超融合平臺運維管理制度》和《超融合平臺應急預案》,從職責分工、運維流程、安全保密、應急資源、應急管理等多個方面提升平臺的安全保障。

四、小結

人行邵陽中支業務網超融合平臺已上線運行2年多,平臺的各項指標性能良好,運行穩定。在這2年的運維中,人行邵陽中支認真觀察、大膽探索,圍繞平臺的安全性、健壯性、便捷性、穩定性開展調研,從平臺架構、平臺運行環境、平臺功能挖掘、平臺制度建設等方面入手,進行大量的實驗及調整工作,實現了構建一個安全、可靠、便捷、高效、節能的虛擬化平臺的目標。

參考文獻:

[1]張棟鍇,郭東旭. 超融合架構在商業銀行省級分行中的應用[J]. 金融科技時代,2019(7):32-36.

[2]張光華. 超融合系統架構在數據中心的應用研究[J]. 通訊世界,2017(9):21-

[3]謝藝平,趙丹銳. 淺析服務器虛擬化常見的安全隱患及其防范措施[J]. 現代信息科技,2018(11):153-154. 

作者:張勇 單位:中國人民銀行邵陽市中心支行