GBASE數據庫助力海南某商業銀行構建高性能、標準化的數據平臺
項目背景
近年來,隨著利率市場化進程加快,互聯網金融發展迅速,傳統銀行受到新興互聯網金融的沖擊衍生出了全新的產品、服務與業態。同時,大數據技術越發成熟,具備更高的性價比、更強的計算存儲能力和更易擴展的數據處理能力,能夠充分發揮全量數據的價值,是各銀行適應互聯網金融及大數據時代的必備基礎平臺。
在海南自由貿易港加快建設的背景下,作為海南省級法人城市商業銀行,海南某商業銀行正處在業務發展的全新階段,各種業務模式層出不窮,數據量日益增多,隨著業務數據的內容和形式不斷豐富,對數據支撐及服務的總體能力提出了更高的要求。為此,基于大數據技術,整合現有行內數據,接入行外數據,搭建并行處理能力強、易于擴展的大數據平臺刻不容緩。
海南某商業銀行通過引入MPP數據庫集群與Hadoop集群的混搭架構,搭建了低成本、高性能、大容量、易擴展的數據基礎平臺。其中,MPP數據庫集群采用南大通用GBase 8a MPP Cluster作為數據平臺的計算引擎層,為整個數據平臺提供強大的計算分析能力。
實施方案
海南某商業銀行通過引入南大通用分布式邏輯數倉GBase 8a MPP Cluster + Hadoop集群,搭建低成本、高性能、大容量、易擴展的數據基礎平臺,實現了結構化、半結構化、非結構化數據的集中采集、存儲、加工、分析和應用,并基于這一技術架構重構數據倉庫、規范歷史數據存儲使用,形成了標準化、高性能的基礎數據體系,為全行經營管理及業務應用提供了數據支撐。
統一數據平臺匯聚了全行主要的業務數據,在流程上,數據平臺率先完成共性數據的加工與標準化處理;在此數據基礎上,進一步建設靈活、自主、開放、易用、安全的數據自助服務門戶,整合數據分析和展示工具等資源,幫助用數部門高效地實現查詢、分析等業務目標;同時提升系統開發效率和需求響應速度,快速支撐上層應用對數據的需求。
GBase數據庫作為數據中臺的計算引擎層,用于實現各類面向主題的模型加工和批處理作業,并提供數據的對外訪問能力,在項目建設過程中,展現了領先的性能及架構優勢:
易拓展:采用完全并行的 MPP + Shared Nothing 聯邦架構能力,為數據平臺提供橫向的容量和性能擴展能力;
數據融合: 杰出的融合能力實現與Hadoop數據湖間的數據透明交互,構建數據全生命周期湖倉一體化解決方案;
高性能且免維護:采用高性能、 免維護的智能索引技術,索引空間占比不超過1%。智能索引包含列的統計信息,在數據檢索定位時可有效過濾數據,大幅降低數據庫磁盤 I/O, 大幅提高海量數據的查詢性能;
高效資源管理:通過資源池及資源使用計劃的靈活配置,實現不同數據庫用戶的縱向的資源隔離,支持對 CPU、內存、磁盤空間、磁盤 IO、并發任務數等關鍵資源和指標進行管控;能夠提供完善的多租戶能力;
數據平臺技術架構圖
應用效果
整個數據平臺部署了十余個節點GBase數據庫產品,納管全行PB級的業務數據,支撐全行外部監管、資產負債、業務管理以及風險管理等各項業務領域的應用。面向全行各項業務領域、多個業務場景,提供大數據深度分析及綜合應用,為業務經營發展提供了高性能的數據引擎。
支持業務目標
實現數據資源統一管理,全面提升數據服務能力,充分挖掘數據價值,滿足全行客戶營銷、風險管控、經營管理及外部監管需要,推動數據治理,提升數據資源管理水平和數據資產綜合應用能力。
低成本和自主可控
基于全國產化的軟硬件環境,顯著降低建設成本的同時兼顧基礎設施的安全可靠,化解平臺在運行、維護、升級等方面潛在的外部風險,保障金融數據安全。
業務連續性
采用Shared-Nothing架構,支持不中斷業務在線按需擴展,有效保障業務的連續性,為業務創新提供強有力的基礎環境支撐。
混搭架構實現全數據匯聚處理
GBase 數據庫可透明實現異構平臺的數據交互,與Hadoop集群共同構建數據全生命周期的湖倉一體化架構。