近年来,随着移动支付的高速发展,银行机构对核心系统稳定性的追求越来越高。例如,应用层面要求随时随地可交易,而且需支持海量用户的高并发访问,对性能和交易时延的要求很高。同时,银行数据大集中的实现对数据稳定可靠性的要求也愈发严苛,如要求7×24小时业务在线交易、数据不丢失等。面对上述变化,银行关键系统的容灾方案开始逐步从传统的“高端存储主备容灾方案”向“全闪存双活方案”演化,即 通过全闪存大幅降低交易时延,通过双活实现系统架构层面尤其是存储层面的自动切换,进而提升系统的冗余度和业务连续性水平。 基于上述理念,华为公司顺应高端存储架构的演进趋势,创新 推出了针对银行核心系统的全闪存双活解决方案 ,并结合业界实践进一步验证了上述方案的可行性。
面向银行机构对业务连续性的极致需求,华为公司推出的金融核心系统容灾方案重点提供了两种架构,且上述架构均采用了关键的双活存储技术及实现双活极为重要的高端存储设备。
生产中心高端全闪存双活-同城复制方案如图1所示。在该方案中,生产中心部署两套高端全闪存存储,实现存储双活,并结合主机集群实现了生产中心应用、主机、数据库、SAN网络和存储的系统级冗余,且任意设备发生故障均可以实现自动切换,确保业务零中断。同时,通过在生产中心与同城灾备数据中心间采用同步或异步复制方案,不仅实现了同城容灾保护,还针对异地数据中心实现了分钟级RPO。总体而言,该方案基于本地双活可充分满足银行系统对高可靠性的要求,适用于大多数国内金融机构。
图1 生产中心高端全闪存双活-同城复制方案
同城双活-异地复制方案如图2所示。该方案通过在生产中心部署一台高端存储、同城数据中心部署一套高端存储,可实现存储设备的跨数据中心双活,即同城双活,而异地数据中心则可以通过存储复制实现容灾。其中,生产中心到同城数据中心采用裸光纤链路,距离一般要求在100千米以内。该方案最大的技术亮点是存储实现了同城双活,生产中心的存储A发生任意故障,业务请求均可自动切换到同城灾备的存储B当中。相对于同步复制,该方案实现了存储层的RTO=0,且与方案一相比,该方案可为生产中心节省一台存储设备的投资。
图2 同城双活-异地复制方案
在架构层面,金融核心系统容灾方案通过在存储列阵中部署两台高端存储形成双活关系,支持SAN和NAS一体化双活。其中,SAN双活通过将高端存储与多路径虚拟化技术相结合,可针对一个双活LUN对,将两台存储的两个LUN对主机上报同一个LUNWWN,并将主机多路径识别为同一个逻辑对象生成“盘符”,进而实现双倍路径、单存储故障以及多路径自动切换。此外,在数据层面,该方案还基于高端存储实现了双写流程,可有效确保两份数据的一致性。
双活架构实现的主要价值如下:
经过20余年的战略投入和持续积累,华为新一代高端存储以“极致可靠”为核心目标,在硬件架构和软件架构层面均实现了重大突破。华为高端存储架构如图3所示。
图3 华为高端存储架构
一是业务零中断,即基于SmartMatrix3.0四控全互联、跨引擎八控互联,实现了硬件架构全互联、引擎内“1+3”冗余,确保业务不中断。
二是实现故障零感知,即通过前端共享接口卡、全局负载均衡、RAID2.0盘负载均衡等关键技术,实现了端到端的A-A架构。
三是基于独有的前端共享接口卡,即便有任意控制器发生故障需进行芯片级切换,也可使主机链路不中断、业务无感知。
四是支持SAN和NAS一体化存储,尤其Dorado NAS功能提升明显,可充分适配金融海量小文件NAS场景,并能够高效满足性能和低时延要求。同时,容器存储采用NAS共享及双活功能目前已逐渐在云平台中使用,比如数据交换平台、容器应用持久化数据等。
五是支持秒级NDU升级、业务零等待,即存储系统软件已经调整为用户态,组件可在1秒内升级完成,且仅为进程级重启,升级内核不重启,从而有效解决了运维管理复杂、升级风险高等问题。
六是采用RAID2.0软件架构,通过盘切片实现了更为精细化的RAID管理,且快速重构可达15分钟/TB,同时SSD磨损更均衡、寿命更长。
七是基于SSD设计的重定向架构,通过ROW实现了所有写请求(随机的、顺序的、大IO、小IO等各种业务模型)都重定向成了顺序写,从而避免了“垃圾”的大量产生,减少了回收工作量。
八是支持端到端NVMe全闪存架构,实现了100微秒时延。此外,还支持控制器级故障的快速切换,即当某一个控制被拔出也可在1秒内完成快速切换,对应用基本无感知。
截至目前,华为高端全闪存作为全球知名的高端存储品牌,已经在银行Core Banking等核心领域开展了广泛应用与实践。
2019年,江苏银行Core Banking采用同城双活方案,选型华为的OceanStor高端全闪存存储(配置四控、2TB缓存),部署同城双活-异地异步复制方案,实现了存储层面的双活容灾。从应用成效来看,通过提取性能数据分析,核心交易峰值IOPS达1.4万,整体方案OLTP模型最大性能达30万,可轻松应对未来移动支付和零售金融的高速发展。同时,该方案夜间跑批读带宽较高,峰值带宽达到1.1GB以上,系统整机性能可达10GB/秒,系统弹性空间较大。此外,新存储阵列读时延均在0.8毫秒以下,日间写时延在0.8毫秒以下,夜间跑批写时延在1.25毫秒以下,且读写时延稳定,并无较大幅度波动。
2019年6月,湖北省农村信用社联合社(以下简称“湖北农信”)引入生产中心高端全闪存双活-同城复制方案,选型华为OceanStor高端全闪存承载了15套A+/A类业务,包含了Core banking、综合前置、统一支付、卡交换、贷记卡、电子渠道、财务、总账等多个关键生产系统。2020年6月,湖北农信存储“全网替换”全面完成,所有业务均稳定运行在华为存储设备。从应用成效来看,OceanStor高端存储高效且稳定地完成了各项任务,特性和性能表现极佳,IO时延稳定在700微秒以内,跑批效率大幅提升。其中,核心批处理(EOD关键步骤)耗时由2小时缩短到16分钟,核心跑批时间由6小时下降到3小时,效率提升一倍。此外,交易读时延峰值716微秒,写时延峰值481微秒,联机交易性能明显提升。
综上所述,为满足银行核心系统的严苛要求,华为公司创新推出了两套核心双活容灾方案,以期为新时代的金融数据安全奠定坚实基础。本文所述方案采用存储双活-复制容灾架构,充分保障了系统级的高可靠性,如SmartMatrix全互联架构、端到端A-A架构、前端共享卡实现秒级切换、秒级NDU、ROW重定向架构、RAID2.0等硬软件架构能力均处于业界先进水平,在为我国金融核心系统安全保驾护航的同时,也必将进一步推动金融行业数字化转型升级。
出自:华为中国政企金融数据存储解决方案总监 李毕生
Copyright 2020-2026 同袍存储 粤ICP备2021121885号网站地图