2023,国产数据库迁移潮
Ai芯天下前言:
从市场需求到业务复杂度,从信创要求到技术架构局限性,当下的种种因素都驱使着国产数据库迁移的加速到来。
根据测算,2023-2027年数据库整体国产替换市场空间约400亿元。
作者 | 方文三
图片来源 | 网 络
现阶段数据库替换开始迁移
现阶段数据库的替换开始从国有大行向农商行等区域银行开始迁移,整体投入非常大。
据2022年9月国资委79号文件,截止到2027年[2+8+N]党政与八大行业完成100%国产替代。
替换范围涵盖芯片、基础软件、操作系统、中间件等领域。然而,目前这些行业的国产渗透率只有10%。
据墨天轮不完全统计,2022年国产数据库行业共收到51次中标喜讯。
其中,金额最大的是中兴通讯、OceanBase、亚信AntDB、万里数据库4家联合中标中国移动1.45888亿元超级大单。
从替换成果来看,今年云原生数据库和湖仓一体数据库的趋势已经开始显现。
综合多方报告来看,OceanBase是目前国内企业使用频次最高的国产数据库,排名第二的是达梦。
而其中在各个行业这个指标也是有所不同,比如银行未来最多计划使用的是华为云GaussDB;
而互联网行业最多未来计划使用的国产数据库是阿里云的PolarDB。
目前看来,Oracle、MySQL和微软等海外数据库在国内部署占比依旧是最高的。
近年来国产数据库的飞速进步的原因
①技术的积累:国产数据库诞生这么多年来,不论是开源还是自研都一直在持续投入,近年来在数据库领域快速崛起,在海外和国内市场都有不少斩获和积累,可以说是“厚积薄发”的结果。
基本上在数据库领域各个关键技术环节,国产数据库都已经有了一定的积累,包括技术人员和高校学生的人才储备,也较以前有了非常显著的提升。
②国内市场的驱动:中国市场的旺盛活力,为国产数据库的崛起提供了一个很重要的机遇。特别是基础软件市场的巨大潜力,也吸引了大量的资本纷纷涌入。
这意味着资本非常看好中国市场的未来发展,也极大地促进了人才的引入和技术的进步,为中国市场带来了非常好的变化。
③业务应用的发展和创新:以银行等金融行业的变化为例,互联网化给金融企业的业务带来了很大变化,量级的飞跃使得银行对数据的要求也截然不同。
在这样的转型过程中,传统数据库的架构和模式已经无法满足应用需要,只有基于分布式一致性的原生分布式数据库才能满足要求。
目前数据库迁移的主要困难
①数据库迁移难度大,占比19.2%,难点聚焦于迁移过程中的兼容性、数据安全、停机时间、数据校验和性能保证等。
②缺乏数据库的一站式管理,占比14.8%,当前市场上的一站式管理平台以管控类为主,主要面向DBA等专业技术人员,而对开发、业务、运维等其他角色的门槛偏高。
③运维与备份的复杂度高,占比14.3%,随着技术路线的灵活度和复杂度提升,运维与备份和难度势必增加。
市场、能力、成本多方面影响数据库发展
Teradata在中国市场的退出反映出国外数据库巨头在中国市场的优势渐退。
随着数据库的替换向核心业务系统领域的推进,达梦数据、创意信息、太极股份、星环科技、海量数据等具备较强迁移能力和相关服务能力的厂商有望占据较大市场份额。
据调研机构Gartner预测,2024年,全球数据库市场规模突破千亿美元。
到2025年,中国分析型数据库、交易型数据库市场来自海外厂商分别将仅剩约30%和50%。
这意味着国产数据库有望迎来换道超车的机会,而生态的发展尤为重要。
据艾瑞咨询预测,2020-2025年以初创厂商为代表的新兴数据库市场规模有望实现高于10倍的增长。
分布式数据库在国内发展迅速,已广泛应用于国内企业,且云化部署已成常态。
从位列前六的第一梯队可见,OceanBase、TiDB、GaussDB、TDSQL、达梦这五款国产数据库依次占据一席之位,仅MySQL一款国外开源数据库位于第三位。
华为发布新分布式数据库可实现云迁移
如今,为获得云计算所拥有的弹性、高可用性和成本竞争力等理想特性,数据库也开启了向云迁移的进程。
今年6月,华为云推出新一代分布式高斯数据库(GaussDB),实现了核心代码100%自主研发,为国内首个软硬协同全栈自主的数据库。
GaussDB基于鲲鹏昇腾生态,同时已经支持开源社区。是国内首个软硬协同、全栈自主的数据库。
即可以实现从芯片、服务器、存储、网络,到操作系统、数据库的全栈迁移及替换。
国内数据库开源加速与开源局限
[国产化]的概念突然被提升到前所未有的高度,仿佛是在一夜之间,大量宣称自主可控的国产数据库出现在我们的面前。
绝大部份国产数据库都是基于国外的开源或商业数据库产品发展而来,主流国产数据库的族谱主要可以分成两类:
MySQL和PostgreSQL,其中PostgreSQL家族占比达到30%,MySQL家族占比达到28%,两者加起来接近60%。
这些基于开源数据库构建起来的国产数据库产品,通常选择两种路线来发展:
①保持和开源社区代码的兼容性:这类产品以开源产品为基础,在上层封装诸如分布式、高可用等功能,架构上类似于搭积木;
可以根据需要选择多种开源产品构建自己的数据库产品。比如TiDB上层选则兼容MySQL的协议,底层则使用RocksDB进行数据存储。
②独立自主研发,构建自己的产品和生态:华为openGauss是这个路线的典型代表,openGauss基于PostgreSQL 9.2发展而来;
在随后重写了数据库内核,并且增强了PG中存在的一些重大缺陷,比如事务ID机制、空间回收机制等。
其实不管是线下还是云上的场景,客户都需要一个国产自研的产品,国产自研数据库已经成为整个行业更新换代的首选。
不过数据库的替代是一个非常大的系统工程,需要有实力的厂商来保驾护航,这样才能保障替换后的业务应用不会出现降级。
结尾:
目前,国产数据库在政策和业务环境等多重因素的驱动下,正在一路狂飙。但国产数据库若想看到爆发点,还需要弯道超车。
未来,数据库领域的核心发展方向是云原生+分布式,以及由此带来的几个核心技术布局。
安全稳定、自动化与智能化、数据库大数据一体化、数据仓库与数据湖、多模数据库以及软硬件结合。
部分资料参考:产业家:《2023,数据库国产替代走到哪了?》,科创板日报:《国产数据库占据半壁江山,A股细分龙头乘信创东风弯道超车》