人工智能推动数据库进化 TigerGraph开拓图数据库新蓝海

常言道

    在科技业,数据库是一个整体规模不大但专业度极高的领域,传统数据库时代还诞生了像Oracle这样的行业巨头;但在新一波数字技术革命下,大数据、人工智能应用的兴起,人们对于数据库的期待已经不再是数据的分类、存储和查询等,而是如何洞察数据内在的联系。
    传统的数据库虽然在名称上被称为“关系型数据库”,但在处理数据关系上并不擅长。在大数据、人工智能大行其道的今天,一种新型的数据库开始崛起——图数据库。据了解,图数据库源起欧拉图理论,也可称为面向/基于图的数据库,它是以“图”这种数据结构存储和查询数据,而不是存储图片的数据库。相比较传统的数据库,图数据库的数据模型主要是以节点和关系(边)来体现,可以快速解决复杂的关系问题。
    创立于2012年的TigerGraph是一家专注于图数据库研发和服务的企业,在创始人许昱博士的带领下,TigerGraph初创的五年里一直专注于产品的打磨,而不是急于推向市场。直到去年年底,TigerGraph正式完成A轮融资,正式向业界推出实时图分析平台。
    
    TigerGraph创始人兼CEO许昱博士
    许昱博士表示,经过过去六年的精心打磨,TigerGraph的产品无论从技术指标上,还是在客户反馈上都是业界领先的;随着越来越多的企业和用户进入到图数据库市场,市场的教育将会日趋成熟,这对我们来说也是一大利好。
    从传统数据库到图数据库 技术进化从未停止
    回顾科技的发展路径,我们可以清晰看出,任何技术的发展和演进都遵循一定的轨迹。比如,在数据库市场,传统的关系型数据库只是那个特定时代的产物,当时用户对于数据库的应用更多集中在数据的存储、备份和管理等方面,对于纷繁复杂的数据背后的关系了解并不清晰。
    但到了大数据、人工智能时代,一切都不一样了。一方面,数据的积累正在呈现出爆炸式增长的态势,数据的分析和管理变得原来越复杂;另一方面,用户对于数据挖掘和分析的要求也越来越高,他们希望洞察数据背后的内涵,真正释放出数据的价值。
    在许昱博士看来,传统的关系型数据库和图数据库有以下三大区别:
    第一,存储模型不一样。关系型数据库的数学模型是表格,但这并不是表示关系的最好方法。比如,一个人拥有很多的个人信息,身份证号、学校、住址等等,但这些信息往往又被存到不同的表格中,真正想全面得到一个人的信息就必须将不同表中的信息拼凑起来;但图数据库并非如此,身份证号和学校等都是一个个节点,这些节点是天然连接在一起的。
    第二,计算模型不一样。关系型数据库的计算模型是扫描、拼凑,这就导致数据的计算量很大,但效率很低;而图数据库不同,它从节点出发,只寻找与节点相关的数据,这样的效率更好。
    第三,数据的查询方式不同。在关系型数据库中,数据的查询指标往往比较单一,但在人工智能、机器学习时代,人们要挖掘数据更深层次的关系,并实现动态、实时的查询,图数据库所表达出的数据之间的关系则更为全面。
    事实上,数据库技术的进化很大程度上也源于算法、算力的提升。过去,大数据算法并不成熟,计算机的性能也不够强大,没有多核、没有并行能力,这些限制在很大程度上制约了图数据库的发展,但今天,这样的基础已经具备。
    潜心研发 TigerGraph图数据库强调“原生”和“并行”
    尽管算力和算法技术在进步,但图数据库毕竟是一个新领域,任何一个新进入者都面临着许多未知的困难。TigerGraph也不例外,这也正是公司产品在去年正式发布前整整研发了5年时间的关键。
    为了实现最优化的体系结构,TigerGraph在研发图数据库之初就选择了从零开始。当时已经有了Hadoop、分布式存储系统等,因此很多的图数据库都是在原有平台的基础上开发的,这样一来开发的量虽然小了很多,但是图数据库自身的性能、分析能力等都比较差。
    为此,TigerGraph用C++从头到尾做了一套基于对图的存储引擎,并在上面构建了一个大规模并行的图计算引擎;同时,TigerGraph还做了针对图的高级开发语言GSQL,以及可视化界面和可视化开发环境GraphStudio,可以实现对图数据库的可视化探索、挖掘。
    “可以说,我们专门做了一套针对图数据库的系统。”许昱博士表示,为此,TigerGraph称之为基于“原生”“并行”图(Native Parallel Graph,NPG)技术的全球首个实时图分析平台,相比较而言,该平台的技术优势体现在以下几个方面:
    首先,实时计算,不超过1亿个节点和边关联的查询一般不到1秒钟一个服务器就可以完成;其次,支持数据库的实时增删改查,是可以上线的数据库;第三,深度关联,用户可以使用TigerGraph针对图的高级开发语言,自己做图模型、做数据录入、做二次开发等。
    图数据库市场方兴未艾 TigerGraph要做新领域的引领者
    数据库技术发展到今天,已经到了变革的前夜,众多业界分析师表示,2018年将是图数据的元年。包括IBM、亚马逊等都在推出相应的产品,这对整个图数据库市场的教育非常重要,此外,用户端对数据分析的需求也在不断增强,他们希望从更深层次了解数据与数据之间的深度关联,以及这种关联能够带来哪些商业价值。
    TigerGraph中国区总经理乌明捷表示,图数据库从数据模型角度是包含传统的关系型数据库的,只是软硬件的发展限制了图数据库的发展,未来图数据库的市场会不断扩大。目前,TigerGraph 的已经与金融、银行、运营商和电力等等众多大型公司达成合作,未来也将在中国市场继续进行市场拓展,扩大图数据库的应用。
    比如,在金融行业,金融企业可以借助TigerGraph系统在企业数据全景图上快速部署复杂有效的反欺诈和反洗钱业务,利用实时数据和实时深度链接分析应对金融犯罪;在零售行业,零售商能够通过实时功能允许快速合成和理解消费者的行为和活动,高效地聚类产品,并提出个性化的推荐。
    乌明捷透露,接下来,TigerGraph首先将在中国进一步推广图数据库技术,让更多的用户接触到这一新技术;其次,TigerGraph将致力推动整个生态的发展,通过开放合作的方式与行业合作伙伴进行合作,落地图数据库的应用;第三,TigerGraph也将在中国挖掘更多的技术研发人才,参与到公司的图数据库产品和技术的研发中来,对产品进行优化,并快速响应用户需求。
    如今,图数据库市场的发展才刚刚开始,但对于TigerGraph来说,公司早已经在这一领域深耕多年。接下来,对于拥有先发优势的TigerGraph来说,如何在图数据库市场全面爆发之时做好引领者,将十分关键。