CDM“何许人也”,为何赢得了诸多企业的青睐?

大数据在线袁绍龙

    如同高跟鞋之于女人,格子衫之于程序员,奥特曼之于小男孩…总有一股说不清,道不明的因子,让他们如同被施附了魔法一般,甘愿沉浸其中。今天,CDM之于企业ITer,也正在徐徐呈现属于它的独一无二的“数据魔法”。
    早在2017年Taneja Group的一项研究就表明,超过30%的公司正在考虑或实施CDM(Copy Data Management,数据副本管理)产品。在国内,金融和运营商行业的多家头部用户也在近两年相继完成了CDM产品的部署和应用… 随着数字化转型进入深水区,数据成为企业最关键的生产资料,CDM“何许人也”,又究竟有何魔力,赢得了诸多企业的青睐?CDM技术“朋友圈”目前聚集了哪些“小伙伴”,这项技术未来又将保持怎样的演进……
    一个数百亿美元的蓝海市场
    统计显示,平均每个企业要为应用开发、QA、用户验收、产品支持、报告和备份等,从生产数据源创建8-10份数据副本。因此,以一个5TB的生产数据库为例,往往要为下游创建出40-50TB的数据副本。一家500强企业甚至拥有超过上千个生产数据库,数据副本达到PB级规模。
    大量的数据副本存在不可避免地造成了一定程度的资源浪费以及维护开销的增长,有数据表明,企业80%的存储能力都被次级数据所使用。
    援引自IDC的数据也显示,目前每年在Copy Data上的开销达到460亿美元,企业内的数据副本消耗了60%的存储空间,并且65%的存储软件和85%存储采购由此产生。
    
    资料来源:IDC
    不仅如此,在传统的生产协作流程中,当开发和测试人员想要获取必须的数据副本时,往往需要从提交申请,到完全准备好环境,耗时几天甚至以月为单位(数据交付时间视数据规模,环境准备情况等而定)。
    这样的数据管理实践并非最佳,不仅大量浪费了存储资源,而且还带来了数据合规和敏捷性等方面的问题,影响了用户应用程序的快速迭代,这对于今天追求敏捷转型和DevOps转型的企业而言难以接受。
    为了帮助企业统一管理海量的非关键性数据,尤其是冗余的数据副本,业界采用了CDM技术。什么是CDM?它的主要应用场景又是什么?Gartner对此提出:它从生产环境通过快照技术获取有应用一致性保证的数据,在非生产存储上生成“黄金副本”(Golden Image),这个“黄金副本”数据格式是原始的磁盘格式,可再虚拟化成多个副本直接挂载给服务器,分别用于备份恢复、容灾或开发测试。
    
    Gartner《Hype Cycle for Storage and Data Protection Technologies, 2020》报告指出,CDM技术已经度过了了早期的技术炒作期,目前处于“泡沫化的低谷期”(trough of disillusionment),这从侧面说明一些客户开始在非关键性业务场景集中部署这项技术,而且Gartner也预测CDM技术将在未来5-10年内进入“实质生产的高峰期”(plateau of productivity)。
    聚焦到CDM技术实现的业务价值,主要体现在以下几个方面:
    第一,降低存储成本。利用数据虚拟化技术,单个数据副本即可满足开发、测试、备份、恢复、数据脱敏、统计分析等多种工作负载需求,同时利用高效的数据压缩技术,进一步节省了存储空间,减少企业不必要的存储开支(以下图上讯信息ADM产品数据拷贝方式为例)。
    
    ADM数据拷贝方式
    第二,缩短数据交付周期。数据准备从原来的按天或者月为单位,缩短到分钟级,数据分发达到秒级。基于CDM技术的数据副本的交付与管理,大大节省了数据交付的时间,为企业构建了更加敏捷的数据管理基础架构,加速了企业的DevOps建设,缩短了业务的开发测试周期,实现了产品的快速迭代。
    第三,降低人力时间投入。传统方式下,数据的导入和导出无法自动完成,面对开发和测试人员的需求,需要通过人为的传递才能完成数据从生产环境到测试环境的迁移,而且这个过程中还可能需要持续的获取增量数据资源。CDM技术实现了全流程的自动化配置和编排,从审批到数据的导入和导出,这个过程只需要在统一的管理界面上鼠标点击操作,几步即可自动完成,极大减轻了存储管理员和DBA的工作负荷,降低人力时间投入。
    第四,提升数据集中管控能力。过去,数据移交到使用部门之后,管控权利完全在使用部门,只能用流程来控制数据的用后销毁,存在较高的安全管控风险。CDM融合了数据动态和静态脱敏,权限管控,合规审计等多种数据保护策略,以集中的数据管控,防范敏感数据泄露,杜绝不当或者误操作,以及保留事后的可追溯。交付使用的数据,可以通过CDM管控平台实现数据的统一集中管控,杜绝测试数据出现数据孤岛,在数据使用完之后,可以实现数据的快速回收以释放占用资源,杜绝暗数据的出现。
    
    
    1  2  下一页>