云数据中心与金融数据中心之对比

近年来,随着云计算、大数据技术的迅猛发展,用云量已经成为数字经济发展的重要指标,国内各行业信息系统向云上迁移的大趋势已经形成。金融业一直是信息化建设的领先行业,在当前国际大形势和国家政策的指导下,金融业的IT架构正有规划、按计划、分步骤地整体向云技术架构转型,以增强核心技术可控性,规避行业系统性风险。

云数据中心与金融数据中心之对比

多年来,金融机构的业务系统,从核心业务系统、支撑系统到边缘业务或创新业务系统,大多构建在传统的集中式架构基础上。这些业务系统数量巨大,系统关联性极其复杂,如何向云分布式架构迁移,是无比巨大和复杂的系统工程。

金融云现阶段建设主要以行业云或专有云的形式为主,典型的云业务系统中SaaS、PaaS、IaaS层划分如图1所示。

云数据中心与金融数据中心之对比

图1 典型云业务系统中SaaS、PaaS、IaaS层划分示意

本文重点探讨云计算技术趋势下金融行业数据中心(Facility)的技术发展以及与金融IT架构向云架构转型之间的关系。涉及数据中心的技术线路、规划设计、建设以及运营等方面。以下的内容是笔者在与金融数据中心行业的专家交流时经常讨论和碰撞的议题,在此我们对这些议题进行进一步探讨。

一、云数据中心与传统金融数据中心

设计思路的差异

简单地讲,云数据中心就是为云业务提供服务的数据中心,主流的云厂商一般都会在同一地区提供多个可用区供企业级用户选择。

腾讯云提供的可用区及可用区的使用如图2所示。

云数据中心与金融数据中心之对比

图2 腾讯云提供的可用区及可用区的使用示意

首先,典型的企业级云业务使用数据中心的要求是:在云的分布式架构下,同一区域多个数据中心的分布式数据库保持着多活状态,在企业级云业务应用中,数据库session的事务操作必须要多个分布式数据库都返回成功,该事务才能被成功提交。

了解完云的企业级应用使用分布式数据库以及对数据中心的要求后,再来对比云数据中心在设计思路上与传统金融数据中心的差异。

传统金融行业(银行、证券、保险)的业务系统是构建在以IBM小型机、ORACLE数据库和EMC存储为代表的集中式IT架构上的。集中式业务架构对下层的IT基础架构(服务器、网络、IDC基础设施)的可靠性和安全性是强依赖关系,使得传统金融数据中心(基础设施)对安全和可靠性有非常高的要求。在设计思路上就表现为:各环节设计余量层层留足、全量的2N全冗余、使用的技术将成熟、可靠、安全的运营管理作为第一要务。

而云的企业级应用是依靠整体分布式IT系统架构实现业务的整体健壮性和高可用性。以腾讯业务架构为例,腾讯云的技术架构是由腾讯自有业务平台的分布式技术架构演变而来的,腾讯的业务架构天然是云架构(分布式),而且是经过海量用户实战验证过并不断快速迭代的。腾讯前CEO张志东曾经有一门课程《海量运营之道》,深刻影响了腾讯技术线路的发展,其中有一条重要规则——业务要与IT基础架构弱耦合。这条规则要求所有平台级业务架构必须充分考虑到业务分布、冗余、可调度和健壮。

以腾讯金融级平台业务财付通为例,财付通的数据中心分布在深圳、上海两地多中心,在业务层每次交易产生的每条记录同时写3~6个副本,一地多活异地备份。每周固定的时间做业务演练,分业务分类型分批次,模拟各种可能的极端故障场景做演练。在机房侧模拟极端场景有:断电、断水、断光纤,从单服务器、单机架、单列机架到整个机房模块不可用,而业务架构上要做自动切换和数据无损。业务的高可靠分布式架构的完善经历了长期和痛苦的过程,而机房侧配合财付通做演练和验证测试,也从最初的提心吊胆到现在的从容不迫、习以为常。

二、腾讯数据中心技术发展线路

正是因为腾讯自有业务和腾讯云高可靠的分布式架构,并且与IT基础架构及数据中心是弱耦合关系,才使得腾讯数据中心可以从质量、成本、效率和安全四个维度,全面和均衡地规划、设计、建设和运营数据中心。我们给云业务团队承诺的相关指标如下:数据中心可用性sla≥99.995%(包括供电、制冷和网络),绿色节能pue<1.4,建设及运营成本在业界具有竞争力,运营效率达到业界领先水平,零运营安全事件。

经过近二十年的发展,腾讯数据中心形成清晰的技术线路,陆续推出了四代数据中心(如图3所示)。模块化、标准化、产品化、自动化及绿色节能是Tencent IDC技术线路演进的遵循的基本要素。

云数据中心与金融数据中心之对比

图3 腾讯四代数据中心技术路线

腾讯数据中心模块化设计是由IT端(机架)、TMDC、机房模块、建筑单体再到园区的整体的设计(如图4所示)。模块化设计中,系统整体效率和单设备效率如何平衡,“颗粒度”的把握是关键。

云数据中心与金融数据中心之对比

图4 腾讯数据中心模块化设计示意

腾讯第三代数据中心(TMDC)的技术特点如图5所示。

云数据中心与金融数据中心之对比

图5 腾讯第三代数据中心(TMDC)的技术特点

TMDC——腾讯微模块数据中心是在借鉴美国集装箱数据中心基础上,结合中国国情,并集成了若干“新技术及产品”,在2012年中推出了V1.0实验局版本,当年试点时国内对该产品支持的产业链非常稀缺。随着腾讯数据中心对TMDC产品的需求不断提升,产品设计版本不断迭代、完善和优化,国内各厂商逐步跟进,二级厂商及产业链不断完善,“模块化数据中心”目前已经成为国内数据中心行业一个成熟、稳定的产品,使用范围也不断扩大。工信部信通院的数据显示,在2018年底国内MDC产品已投产超过8000套,折合机架约12万个。

TMDC实际上是对传统数据中心的部分模块化:将末端配电系统、末端空调系统和机架有机的设计成模块化产品,而高压配电、柴油发电机、水冷机组、水冷管路等仍甩在外边,维持原设计。

腾讯数据中心获得的相关国家专利及参与制定的行业标准如图6所示。

云数据中心与金融数据中心之对比

图6 腾讯数据中心获得的相关国家专利及参与制定的行业标准示意

在技术上,TMDC首次大规模使用了一路市电直供一路高压直流的模式,实际将供电效率提升到94%以上;在空调末端使用了行间空调,缩短了送风距离,标准化了内部气流组织,提升了供冷效率;同时将电池直挂高压直流模块的输出端,简化了配电结构,提升了供电可靠性。

目前,TMDC已经演进到V3.5版本,是腾讯数据中心的主流技术架构,在自建、合建机房已投产的数量超过2500套,实际运行服务器和网络设备超过40万台。经过8年的大规模应用,证明该系统架构和产品是成熟、稳定和可靠的。

三、几个关键技术的风险评估

TMDC使用的几个关键技术,在业内也引起了广泛的关注和争论,主要集中在以下几点:

(1)水系统消防

TMDC内使用的是预作用水喷淋消防系统,而“水进机房”在传统数据中心里是不被允许的,主要是担心水系统环路、阀门漏水、喷射造成机房里IT设备损坏。在集中式业务架构中IT设备昂贵、单设备价值高,所以在传统数据中心内都配置的“七氟丙烷”之类的气体消防系统,要求对设备影响尽量较小。但此类消防气体对员工身体的损害是毋庸置疑的。而在云的分布式业务架构中,使用的是低价的X86架构的PC服务器及相关网络设备,而单个预作用喷头覆盖面积大概可作用6~8个机柜,其中受影响的IT设备数量和价值是可以预估的。在当前的社会环境下,当发生火灾时是以人为本还是以设备为本,相信大家都有明智的选择。

(2)行间空调

TMDC使用的行间空调将制冷水的回路引入了IT机房模块,设计初衷是为了缩短冷源与IT设备的距离提高供冷效率。但将它们安置在相邻的机柜里是否会带来“水浸机房”的风险?我们在设计上的主要考虑要素为:一是TMDC整体高出机房地板20~30厘米;二是TMDC下安置导水槽;三是TMDC下安置漏水检测线特别是水分配单元下,并接入集中监控;四是水分配单元整体封闭、阀门位于地板下。经过8年多上千台TMDC的实际投产运营,通过每天实际监控和量化数据,表明漏水属极偶发性事件,且即使发生也能被及时发现和处理,运营风险极低。

(3)高压直流模块

2012年TMDC在配电系统中引入270V高压直流供电前,电信行业内已经试点过多年,可以证明通讯设备电源对高压直流可以广泛支持和适配。在2012年后腾讯力推TMDC技术线路,国内各IT厂商在设备电源适配上也逐步完成对高压直流的支持。目前,腾讯有数十万台服务器和网络设备运行在高压直流供电的环境下,经过多年的监控和量化的运营数据分析也并未发现故障率异常。如果后续金融数据中心要引入高压直流技术,也应该首先考虑IT设备(特别是特殊设备)对高压直流电源的适配性问题。

腾讯下一代数据中心架构被称作T-block,是在TMDC的基础上进一步的模块化和产品化,并在国内第一次大规模使用间接蒸发制冷技术和产品。

四、腾讯微模块数据中心的特点

(1)去工程化

TMDC将部分建设工程产品化,在缩短建设周期的同时提升了建设质量,并可以实现分批分节奏交付。

(2)绿色节能

由于使用了一路高压直流一路市电直供、行间空调等设计,并结合运营中的节能优化技术,TMDC在腾讯深圳光明IDC的年均PUE可达到1.28,在腾讯上海青浦IDC的年均PUE可达到1.26(根据过往实际运行数据,具体如图7所示),当前各地政府纷纷出台对数据中心能效指标的限制政策,数据中心的技术架构如何能既满足国家及当地政府的节能监管要求,又满足成熟、可靠、性价比高,TMDC根据多年的实践经验和运营数据,给出了一个切实可行的整体解决方案。

云数据中心与金融数据中心之对比

图7 腾讯微模块数据中心(TMDC)在腾讯深圳光明IDC的年均PUE

在数据中心节能环保及提升能效方面,腾讯数据中心做了大量的工作,我们后续有计划逐步公开部分自建和合建数据中心的PUE相关数据。

(3)自动化和智能化运营

TMDC是由用户方主导设计的一个产品,在设计之初就充分考虑到了用户方使用的场景和需求,并通过指定交易硬件及软件标准,要求各厂商遵循。因此大家可以看到目前市面上的MDC产品标准化程度很高,从MDC的框架到内部二级设备的规划、尺寸、容量及性能,以及之间接口协议,基本实现了标准化。标准化是实现自动化的基础,通过“南向接口协议”,我们已经能够实现已投产的超过千套TMDC的监控和集中化运营。

得益于架构上的标准化和版本化,我们还在构建以TMDC为基础的数字化模型,通过各种传感器将实际硬件设备的实时运行状态与数字模型相互关联,将设备的运营数据进行集中化的收集和处理,为设备全生命周期管理、健康度管理和后续的智能化运营奠定基础。

五、新形势下金融科技的创新与风险的平衡

2019年8月人民银行印发的《金融科技(FinTech)发展规划(2019-2021年)》指出,金融科技是技术驱动的金融创新,强调了创新;重点提到了合理布局云技术,引导金融机构探索与互联网交易特征相适应、与金融信息安全要求相匹配的云技术解决方案。并强调做好新技术金融应用风险防范和提升穿透式监管能力。

互联网公司的云数据中心使用的架构和相关技术,只是他山之石,是否适用用于金融数据中心,要与金融行业的业务架构及金融机构安全管控等级相匹配。如何平衡创新和安全的关系,做好新技术的风险防范和透明式的监管,预计将是金融行业下一阶段的重要工作。

来源 | 中国金融电脑
作者 | 腾讯IDC平台部运营服务总监 肖力

版权声明及安全提醒:本文转自网络平台,文章仅代表作者观点,不代表「金融文库」立场。相关版权归原作者所有,「金融文库」仅提供免费交流与学习,相关内容与材料请勿用于商业。我们感谢每一位原创作者的辛苦付出与创作,如本转载内容涉及版权及侵权问题,请及时联系我们客服处理(微信号:JRwenku8),谢谢!

(0)
上一篇 2020年3月10日 上午10:17
下一篇 2020年3月10日 上午11:10

相关推荐