新趋势下,国产数据库或“春山可望”

科技云报道

从540亿元到1286亿元——这是中国通信标准化协会大数据技术标准推进委员会针对中国数据库行业给出的一份预测报告。
    报告指出,未来五年,中国数据库行业将从百亿级市场跨越成为千亿级市场。
    最近两年,中国的数据库行业似乎也在迎来一轮新热潮,而这种热潮是伴随着5G、云计算、大数据和AI等多种技术共同出现的。
    在企业数字化加速到来的同时,企业对于各类数据分析的需求也被越发放到台前。
    种种变革之下,数据库行业是否将迎来新的发展?
    
     数据库发展出现新趋势
    如果将整个软件产业体系比喻成一棵参天大树,数据库则处于其中最核心的基础部分,支撑着大部分的软件生态,进而使整个数字中国各行各业核心业务系统的正常运转。
    数据库以其技术门槛之高、研发周期之长、工程要求之高而被誉为“基础软件皇冠上的明珠”。
    而在过去很长一段时间里,国内市场几乎被海外数据库厂商所垄断。数据显示,微软、亚马逊、Oracle三家占据全球数据库市场三分之二以上的份额。
    数据库更是被列为国家35项“卡脖子”的关键技术之一。
    近年来,随着国家对信息安全和自主可控的要求不断提高,国产数据库市场也在逐渐崛起。在这个领域里,国内企业不断加强自主研发能力,推出了一系列具有自主知识产权的数据库产品。
    无论是传统数据库厂商、云数据库厂商,还是新兴势力,都在不遗余力地打造各种类型的数据库,各种产品在不同领域都有着广泛的应用。
    中国数据库虽然进入了高速发展阶段,但面向更大规模、更复杂应用场景需求,达到好用的技术水平,实现可复制、可推广国产数据库,还面临着大量的技术攻关、产业生态优化、应用协同等方面的难题。
    换句话说,大而不强、多而不优的局面还没有发生根本性的改变。
    但值得注意的是,新的技术浪潮正在推动中国数据库市场快速变化。在2023年度十大科技名词中,大模型位居榜首,数据要素也名列前三。
    首先是火热了一年的大模型。
    今年以来,AI Agent和AIGC等技术都是上层应用赛道里的关键词,而底层技术的变革总是要来得相对慢一些。在数据库行业,一个可预见性的趋势是AI+BI+DI。
    事实上,这种趋势并非出现在大模型时代,在更早之前它就是数据库行业里的一个畅想。但由于技术不够成熟,导致这种畅想并未实现。
    具体而言,在AI、BI与DI三者的结合中,AI的这部分能力由大模型厂商来提供相应的能力;数据库厂商提供的能力则在底层的数据处理分析上。
    其中,DI相当于一个接受数据加工请求的平台;BI则是将这些数据分析结果用可视化的方式呈现出来。
    只是在大模型时代,AI可以更好地理解用户意图,再基于底层强大的数据计算加工能力,即可实现更加丝滑、低成本的数据分析体验,将底层数据库的加工和分析结果在BI上呈现出来。
    实际上,这种模式的落地不仅是站在AI大模型新时代的风口之下,也更是在市场的期盼之下。
    正是在AI+BI+DI模式的驱动下,数据库行业将更加重视公有云模式。一方面是考虑到成本因素,另一方面则是数据使用模式的灵活度。
    在全球数据库市场中,云数据库的市场份额近两年也得到了大幅提升。不仅如此,近两年的云数据库占比已经超过本地部署的数据库。
    大模型时代,在数据库领域,公有云模式将成为一种新的趋势。
    其次,在2023年度的科技关键词中,数据要素也将在数据库行业发挥更重要的角色。
    在国家数据局发布“数据要素×”三年行动计划中明确提出,推动满足资产确认条件的数据资源,计入资产负债表无形资产或存货,推动数据资产化。
    而相关部门发布的规定也将于2024年1月1日正式施行。
    随着2024年数据资产的入表,将催化数据库行业走向新的发展高度。
    未来,企业会越来越重视数据层面、资产层面的建设。过去粗放式的数据使用模式,在外部更强的监管要求下,也会朝着精细化的模式进行升级。相对应的,数据建设和治理在企业内部会变得更加合理。
    更具体地来看,数据资产在企业内部相当于一个“底座”的作用。
    在整个数据共享机制的构建中,一个最常见的问题是数据孤岛的存在。由于企业内部为了解决多个问题所构建的多个技术栈,而在不同组件下产生的数据割裂现象。
    对此,湖仓一体架构在解决数据割裂问题方面成为新的解决方案。数据湖的能力可以将用户的数据底座统一起来,从而达到数据共享的效果。
    而在湖仓一体技术架构基础上,数据也可以以各种格式存在于数据湖里,通过湖仓一体的分析来支撑企业对于数据使用的不同诉求,进而更有质量地构建自身的数据资产。
    从各类做湖仓一体的数据库厂商来看,各家技术路线各不同,有些选择自研,有些则基于开源,而有些是自身云平台的产品组合,但最终目的都是为了降低数据在不同平台间的流动。
    数据库国产替代在路上
    从2000年前后,我国开始陆续出现商业数据库厂商,其主要代表有达梦数据、人大金仓、神舟通用、通用数据等。近年来,国内互联网、通信科技巨头阿里、腾讯、华为等公司也纷纷加速布局数据库产业,借助云计算优势进行相关数据库服务的研发。
    目前中国数据库市场总体规模在全球数据库市场占比较低,但数据库厂商数量显著多于全球其他国家和地区。根据中金企信统计数据,2022年6月,中国数据库厂商已超过200家。
    大量中国数据库厂商的出现,为挑战传统数据库巨头带来了更多可能。
    在Gartner 2023年数据库魔力象限报告中,阿里云的PolarDB成为唯一进入领导者象限的中国数据库。
    同时,被荣誉提及的十家数据库厂商中,也有四家来自中国,分别是:OceanBase、PingCAP、华为云、腾讯云。
    但也需清醒地认识到,目前国产数据库发展还比较缓慢,从实际应用来看,仅在党政军领域应用较多,而在其他领域应用较少。
    据智研咨询发布的《中国数据库行业市场调研分析及发展规模预测报告》数据显示,截止2022年我国数据库规模国产化率达21.3%。
    换句话说,国产数据库想要实现真正的领先,还有很长的路要走。
    首先,从数据库的发展可以看到,这一行业需要长时间的技术积累,例如Oracle从1978年开始至今已有40多年的历史,才发展成如今的规模。
    其次,做数据库一定要有一个完整生态,例如自从x86替换小型机,DB2的市场份额逐渐下降以及软硬件分离的趋势,导致Intel、微软的操作系统得以普遍应用,在此生态下才有Oracle、MySQL发展壮大的机会。
    不过,近年来国家积极推动国产数据库的发展,监管部门陆续发布多个文件,明确提出“提高新技术应用和自主可控能力”“加大数据中心基础设施弹性供给”等要求。
    尤其在2022年9月底,国务院国资委下发了重要的《国资发79号文件》,文件中明确指出,自2023年1月起,每季度末向国资委报送信创系统替换进度。
    最终要求2027年底前,实现所有中央企业的信息化系统安全可靠的信创替代。
    一系列的政策出台都在推动着国产数据库从应用到生态的全面建设。同时,国内数据库行业在各种新趋势和新技术的加持下,也将进一步加速行业发展和规范。
    积于跬步,方能行至千里。中国数据库还要经历漫长打磨的过程,在新一轮科技革命的大潮中,这条漫漫长路显然才刚刚开始。
     相关阅读
    向量数据库:AI时代的下一个热点
    数据库市场迎来大变局,“后来者”云原生数据库将成企业必选项
    PingCAP黄东旭:Serverless是数据库的未来形态
    【科技云报道原创】
    转载请注明“科技云报道”并附本文链接