从云、大数据到人工智能 中国太保践行数字化转型
近一两年中,转型成为了企业管理者最常提及的话题。在飞速发展的时代,搭上技术的顺风车,可以为企业提供无数业务创新的机会,从而保持领先的地位。比如保险行业。
一方面,每一家保险企业都在努力探索如何提升用户满意度、如何在正确的时间提供合适的保险产品;另一方面,由于保险行业整体市场增长逐渐趋向饱和,竞争对手的产品和服务品类愈发丰富多样……企业需要通过技术的创新来适应不断变化的市场环境。而“云计算”则成为了多数保险企业开启数字化转型的首选。
中国太保的“三朵云”
成立于1991年的中国太平洋保险公司(以下简称中国太保)是国内领先的综合型保险集团公司,业务覆盖人寿保险、财产保险和资产管理等多个业务领域。中国太保的云计算正式落地是2015年,基于上海和成都两个数据中心搭建,接下来云还会扩展到正在规划中的第三个数据中心上,最终实现两地三中心的整体云布局。
据中国太保首席架构师张文若介绍,中国太保主要部署了两朵云:为分公司提供服务的“机构云”,以及承载所有开发测试环境的“测试云”。“测试云”主要面向开发测试,达到了7000多台虚机、5000多台物理设备的规模,充分满足了资源灵活利用,为支持开发测试的顺利进行提供了很好的管理工具;“机构云”面向下属各分公司,支持下属公司的各种需求。除了这两朵已经建成的云之外,中国太保还在规划“生产云”,计划到2018年部署,来支持核心业务的运行。
云平台的建设对中国太保的积极作用是非常明显的。首先,大幅改善了底层基础设施的安全和稳定性,保证了中国太保关键业务的连续性的同时,将分公司IT部门的所有精力从基础运维层面转到了数据分析、支持市场业务需求的工作上来。而最明显的一点,通过规模化、集约化的管理,为中国太保每年节约了不少的IT成本;其次,各个分公司通过统一升级到集团技术标准,让分公司之间得已相互借鉴和参考应用部署方面的经验。
回忆这场上云之旅,张文若有件事印象深刻,就是从小型机到x86的迁移。中国太保早期的系统搭建在小型机上,不过没过多长时间,中国太保就已经发展到了上百个IT系统,带来很大的成本压力。
随着x86平台的日趋成熟,中国太保决定将绝大多数数据库服务器和所有应用服务器迁往x86平台。对于这样大规模的迁移,张文若回忆主要是出于两方面的考量:成本和性能。张文若说,在成本方面小型机和英特尔基于x86架构服务器有着几十倍的差距,后者更具成本性的优势。并且在当时来看,x86服务器在CPU计算能力、稳定性上面,已经发展到与小型机不相上下的态势;加上英特尔为x86服务器上的虚拟化平台所做的优化,可以满足高可用的资源池和解决方案的管理。张文若表示,英特尔给企业提供了更多灵活性,更低成本的解决方案。
此外,除了考虑到成本和性能的因素,中国太保在选型方面也是有着自己的标准。“包括产品成熟度、市场占有率、技术先进性等一系列因素都需要纳入到评估标准中去,最后再通过POC测试,用真实的业务实践去做出精准的判断。”张文若说。
而今天看来,随着英特尔更具可扩展性、更高性能的至强可扩展处理器的推出,x86平台在成本和性能上的更具优势,中国太保当初的这一决定也显得更具预见性。
值得一提的是,在云平台的建设中,太保一直是新技术的积极使用者。张文若告诉记者,在底层硬件的选用上中国太保大胆采用了超融合设备+普通设备的组合模式,来进一步简化运维方面和云资源的管理。同样,在SDN方面,太保采用了TRILL大二层架构,构建多个业务区服务器资源池,支持平滑演进到SDN,实现业务快速部署和上线。
用DCOS构建PaaS云
中国太保通过IaaS的建设主要解决了资源的自动化管理和自服务供应问题,但对资源的细粒度共享和弹性伸缩能力不足。比如,很多系统的业务峰值CPU利用率会达到100%,但是平均利用率却不到1%,而容器技术有望解决这一问题。于是,在IaaS平台之上,中国太保开始部署PaaS,在中国太保就是DCOS(Data Center Operation System)平台。
2015年底,中国太保开始使用Docker+Mesos来构建自己的PaaS云,以此来支持企业的业务活动,并于一年后正式上线。基于这个平台,中国太保顺利完成了“除夕摇红包”、“初五迎财神”等市场活动。针对这几个活动,中国太保DCOS平台采用223个主机节点,其中平台部分由5个节点构成Mesos Master Cluster,80个节点构成HAProxy Cluster,138个计算节点承载674个Docker Container,其中动态计算节点113个,静态计算节点25个。该平台可在1分钟内轻松实现扩展到1000个以上Docker节点。
从事后的数据统计结果上来看,使用传统架构来实现业务支持几乎是不可能的。不仅资源准备周期长,同时部署过程繁琐,无法如期满足业务活动需要。即便连夜赶工完成,可能也要面临部分节点故障导致的一系列应用服务器问题。
此外,在传统架构上,由于中国太保大部分应用运行在虚拟机上,每个节点的资源利用率上很不平均,部分应用服务器可能在活动中,并不会存在大并发量或者产生很多业务数据,但却还要占用相当一部分资源。再加上如果压缩资源,相应的应用维护压力也会相应出现,如何保障应用服务器稳定,这也是一个待解决的难题。而通过以Mesos、Marathon为核心,实现容器资源的分布式调度与协调;加上Redis将Session数据集中存储,并使用容器挂在共享NAS的方式来集中存储文件等技术很好地支撑了这些市场活动。
值得一提的是,目前中国太保的云还是私有云模式,张文若说这主要是出于安全的考虑。“目前国内保险行业主要以私有云为主,不过未来以公有+私有的混合云模式将会越来越多。”
实际上,究竟哪种云模式将会成为未来市场中的主流,类似的话题一直在业内被热议。在英特尔发布的《在公有云、混合云和私有云间合理放置工作负载》表皮书中谈到,不存在某个最佳的云模式或服务集能够适用于所有企业,企业需要认真考虑业务需求和工作负载的技术特征,包括性能、安全、集成和数据要求等。然后再考虑云生态系统,即包括业务需求匹配的合适CSP、特定工作负载的SaaS成熟度,以及使用企业业务的商业解决方案等。
1 2 下一页>