AI+云原生,偶数科技数据仓库之路怎么走?


    文|罗宁
    光锥智能获悉,8月25日,云原生数据仓库和AI产品公司偶数科技宣布已完成近2亿元B+轮融资。据悉,本轮融资由国内某头部科技公司领投,早前参与投资的红杉中国、红点中国等多家投资方跟投,Scale Partners势乘资本担任独家资本顾问。此次融资也是2020年11月B轮融资以来偶数科技最新一轮融资,对国内云原生服务领域具有重要意义。
    数据库与芯片、操作系统,被称为科技圈最难做的三大事情。云原生数据库在近年来以强势姿态成为企业服务的市场新星,2020年上市的Snowflake更是创造了巴菲特打新、上市首日市值突破700亿美金的“最强软件IPO”神话,而今年完成G轮10亿美金融资的Databricks也成为估值300多亿美元的超级独角兽,但若把目光放在国内,下一个数据库领域的百亿美金“云上独角兽”究竟是谁?
    偶数科技自成立之初便将目光放在云端数据仓库,其在自研云原生架构方向的进展颇为迅速,不仅通过AI+金融,AI+公安等行业解决方案完成了垂直赛道的深入布局,也已经与建设银行、浙商银行、中国移动、中国联通、国家电网、南方电网、VMware等诸多行业头部企业建立深度合作,成为云原生数据仓库的重要玩家之一,伴随其最新一轮融资,这家公司在企业数据库赛道的布局也愈发清晰。
    据不完全统计,2019年至2020年底云原生领域发生了20笔以上融资,包括红杉、高瓴、IDG、线性资本、经纬、赛富、BAI等一线VC以及阿里巴巴、腾讯、字节跳动在内的CVC等均参与其中。
    根据Gartner 2020年数据,全球企业数据库市场规模为648亿美金,增长率达到17.1%,其中增量部分90%来自云数据库,Gartner预计在2024年,全球数据库市场将超过1000亿美金。庞大的市场意味着前所未有的机会,目前在国内,数据库市场仅占全球市场的8%,在数据库上云的浪潮之下,谁将顺势站上潮头?行业又将如何发展?“弄潮儿”偶数科技又为我们带来哪些启示?
    “弄潮儿”云原生数据库
    在中国,企业数据库“去IOE”的口号喊了多年,但真正步入快车道却也只是近几年发生的故事。
    根据CNIC统计,过去几年,云原生关键技术被广泛采用,有43.9%的用户已在生产环境中采纳容器技术,超过七成的用户已经或计划使用微服务架构进行业务开发部署,风向的转变,为偶数科技找到了行业突破口——云原生数据库。
    
    业内有一种说法,云原生数据库服务对于当代企业如同水和电,企业并不用关心这些能源来自哪里,但有需要时能根据需求及时调配。而在传统数据库当中,企业不但需要付出人力物力自己造电厂和水站,还往往要忍受低效率、高成本等一系列障碍,这对一些特定需求的客户来说并不划算。
    察觉到这样的机会,偶数科技打造了将存储与计算分离的OushuDB云原生数据仓库,用户可以选择方便自己的云端存储,而且只需要按照自己的计算量和存储量需求为OushuDB进行付费。OushuDB的存算分离架构及新一代SIMD执行器不但将数据处理能力提升了5-10倍,也提供了波峰波谷来的不同计费方式,因此相比传统数据库公司的运营模式更具亲和力。
    作为前EMC研发部总监,Apache HAWQ顶级数据库项目创始人,偶数科技创始人兼CEO常雷博士不仅在计算机领域和人工智能领域拥有丰富的行业经验,也在过去多年将云原生架构推向更深层次,率领偶数科技团队研发的OushuDB不但具有MPP的所有优点,还具有弹性、支持混合工作负载和高扩展性的优点。
    针对不同企业的特殊需求,OushuDB提供了出色的兼容性,遵循ANSI-SQL标准,能够兼容Oracle,Greenplum Database和PostgreSQL,提供PB级的数据交互式查询能力,也因此具有更好的场景拓展性。
    此外,OushuDB还可以原生支持LittleBoy自动化机器学习平台,利用云数仓结合机器学习的能力就可以建立企业所需的各种模型,因此能够实现反欺诈、金融风控等功能。
    市场也在为新技术投赞成票。根据中国信息通信研究院相关调研数据显示,2019年我国云原生产业市场规模达到350.2亿元人民币,“新基建”带来的万亿级资本投入,也将在几年内推动云原生产业的发展迈向新阶段。而根据Gartner预测,2022年75%的数据库将被部署或迁移至云平台,只有5%的数据库会考虑部署在本地。
    云技术和数据库的融合,正在突破过去基于物理服务器部署的传统数据库存在的高成本、低效率、稳定性差等诸多问题,为用户提供高弹性、分布式、低成本的使用体验,正如偶数科技创始人兼CEO常雷博士所说:
    “云原生架构的优势能够实现传统方式所做不到的事情,这是为什么新一代云原生厂商能够和AWS、Oracle等对手进行竞争的原因。”
    不过,不同于Snowflake只提供公有云领域的云原生服务,偶数科技的云原生架构既能够满足公有云、也能够支持私有云服务,尤其对于国内市场如今依旧占比较高的私有云领域,偶数科技提供的支持也是其能够快速发展的原因所在,据常雷博士介绍,包括金融领域的许多重要客户,依旧以私有云为主,这也成为偶数科技相较于Snowflake的优势所在。
    为企业上云按下“加速键”
    云原生概念至今已有8年,但真正在近几年成为行业共识的原因,还是在于以下四个方面:数字化时代浪潮、新基建等相关政策、技术底座日趋成熟、线上协作加强。而这四大要素的不断加强,为企业云原生服务也愈发多样化。
    Scale Partners 势乘资本&光锥智能发布的《云原生——IT领域的“共享经济”》报告显示,企业上云经历了四个阶段:第一阶段虚拟化整合+IaaS 阶段;第二阶段IaaS+简单SaaS应用阶段;第三阶段丰富SaaS应用+PaaS平台阶段;第四阶段全面云化、自动化管理和服务的阶段,而云原生则符合企业上云第四阶段的表现,即全面云化、自动管理和服务。
    
    作为创新型云原生数据服务公司,偶数科技建立了偶数数据云,包含Oushu Database(即OushuDB)新一代云原生数据仓库、Oushu LittleBoy自动化机器学习平台和Oushu Lava数据管理平台三大模块的企业数据服务系统。
    通过对数据基础设施进行云化改造,构建数据云平台,是企业提高数据基础设施对云环境适应性的必经之路。而偶数科技数据云平台依托云原生特性、计算存储分离架构、强ACID特性、强SQL标准支持、Hadoop原生支持、高性能并行执行能力等一系列底层技术的变革,使企业在云环境下能够更充分发挥数据的价值,帮助企业更好的适应数字化转型进程所带来的变革。
    另外,不得不提到的一点,偶数科技在开源技术方面持续投入,如今已经成为云原生本土开源领域的重要贡献者。近几年我国云原生技术领域涌现出大量的国内公司主导的优质开源项目,不仅有助于构建高质量的开发人员社区,同时也加速了企业技术创新的速度。
    比如腾讯开源的微服务框架TARS贡献给了Linux基金会,常雷博士作为Apache HAWQ顶级数据库项目创始人,对于Apache开源社区也做出了不少贡献。Apache HAWQ在项目进行过程中,将存储构建在分布式文件系统之上,实现存算分离,不仅解决了MPP的性能瓶颈,同时也解决了传统架构的可扩展性问题,而这也成为了偶数科技早期成立的基础。
    数据库与芯片、操作系统,成为科技圈最难做的三大事情,全球绝大多数数据库由国外厂商开发,可用的国产数据库寥寥无几。原因就在于研发难度极高,且缺乏优质客户早期试用陪跑。常雷表示,行业中一个成熟的数据库有上百万行代码,每一行代码都需要耐心和经验,对于工程师团队考验极大,偶数科技超过60%的员工为研发人员,在做一个新架构时,只有几个层面的团队共同发挥出最好的水平,才能设计和打磨出一个好的底层数据库。
    也正因如此,数据库公司只有长期、高水平的技术积累,才能够在如今的市场竞争中拥有一席之地。
    如果说上云是解决企业数字化的基础问题,那么云原生的价值则是帮助企业更好地提升数字化效率。其实,云原生的价值在业务数据量波动较大的行业中更能得到体现,例如银行、运营商、基因检测、智慧交通、工业互联网、快递物流等领域。
    根据IDC预测,全球分析数据管理及整合平台以及商业智能和分析工具市场在2023年底将达到840亿美元,可以说这是一个非常大的市场,而参与其中竞争的巨头诸如Snowflake、Databricks等公司不但被硅谷投资人长期看好,更是在上市之后估值不断上涨,而在国内,偶数科技作为云原生数据仓库服务商,不论在商业模式还是技术突破上,也始终和海外巨头保持相似节奏。
    正如常雷博士所说:“多云、跨云、混合云已经成为当前企业上云的业务趋势,作为中立厂商,偶数科技能够满足不同客户的数据处理需求,拥有相较传统数据库5-10倍的性能提升,同时方便用户迁移。”对于趋势的正确认识,或许正是偶数科技能够快速成长的秘诀所在。
    2021年3月19日,中央政府采购网发布《中央国家机关2021年数据库软件协议供货采购项目》中标公告。其中,偶数科技的新一代高性能数据仓库OushuDB中标,证明了偶数在数据库领域的产品实力和技术创新价值。
    当然,目前也要认识到云原生技术依然处于上升阶段,除了技术本身是个新概念外,还有一部分客户对它还存在诸多顾虑。《云原生——IT领域的“共享经济”》研报显示,61%的客户对云原生技术在大规模应用时的安全性、可靠性、性能、连续性心存顾虑,如何能够针对客户提供更优质的服务,依然是摆在偶数科技在内的创新型公司面前的重要课题。
    不过,由于目前使用上一代传统数据库的企业普遍存在数据库规模有限、弹性能力差、查询效率低、数据孤岛、上云困难等痛点。即将到来的云原生数据库时代,这些痛点将被逐一击破。这也是云数据库在全球市场中爆发式增长的重要原因。
    红点中国合伙人刘岚在接受采访时表示,在云原生领域的创业方向目前主要有两种,一种是提供云原生解决方案,另一种是既提供开源解决方案又提供产品。目前在国内更主要在寻找后一种类型的创业公司。他还认为,中国当前存在几大公有云,开源是创业公司一条较好的道路,通过开源可以很好地构建生态,包括开发者生态,之后才能去寻找更好的商业模式。在这个赛道上,有工作经历和技术积淀的创业者会更有机会把开源的产品做出来,红点创投在美国投资的Snowflake、红点中国在本土布局的偶数科技就都具备这些特征。
    但是,过去20年间,大数据&AI系统的技术架构演进由三方面推动:海量数据分析需求、开放开源的技术进步、以云为代表的软硬件基础设施升级。这意味着围绕云服务和AI技术,以云原生架构作为基础的偶数科技能够继续打磨自身技术,面向企业提供更具优势的AI和大数据服务,云原生是行业发展大趋势,而对创业公司来说,机会还有很多。