知识图谱走出至暗时刻

数科星球

    世界拥有不计其数的实体,以人力已无法将实体和概念建立完整的联系,而知识图谱可以弥补这样的空缺。
    @数科星球 原创
    作者丨科科  编辑丨十里香
    人工智能行至半途,在各行各业,AI的渗透与日俱增。作为人工智能的分支,知识图谱可谓历史已久。如今,新的应用场景被开发,一幅技术革命的画面已然呈现在世人面前。
    01
    沉默的技术高地
    和大多数的AI技术一样,知识图谱也是一种交叉学科,其横跨了包括知识工程、自然语言处理、机器学习、图数据库等在内的多个领域。
    在构建知识图谱的流程中,也要通过知识建模、关系抽取、图存储、自动推理、图谱表示学习、语义搜索、智能问答、图计算分析等一系列步骤才可得以完成。
    在这个角度上,说知识图谱是复杂的技术并不为过。
    在这项技术的发展时间线上,数科星球(ID:digital-planet)看到,其有谷歌、百度等搜索引擎企业参与,再到后来,知识图谱开始走出大企业,开始在医疗、金融和安全等领域发挥作用,人们喜闻乐见的小度音箱和天猫精灵等产品更是新一代知识图谱技术应用的集中体现。
    由大型搜索引擎公司所构建的知识图谱,正在赋能于垂直,其提供了更多的旨在表明实体和关系的语义信息,可以赋能用户在不同场景下查询。
    如今,市面上仍然可以看到上一代知识图谱产品的影子:比如出现在谷歌搜索结果信息流右侧的知识卡片等等。
    知识图谱技术支撑起了互联网发展的下一个高峰。机器人的聊天、企业服务行业的智能问答产品以及现在的搜索引擎中的智能推荐,都用到了知识图谱功能。总的来说,知识图谱正在走出通用的象牙塔,向着垂直领域发展。这种垂直不仅意味着垂直行业,更意味着在决策、推荐和问答场景中的细分。
    现在,在知识图谱界已出现两大技术方向——其一是数据互联网,可以理解成基于网页的产品形态;其二是事物互联网,其交互场景不以传统互联网形态存在,如在数科星球(ID:digital-planet)报道过的汽车后市场、高铁等领域就以音频等方式存在。
    所以,未来知识图谱的竞争将在人们看不见的语义网络中展开。在巨型企业中,语义网络的竞争已经成为常态,其中谷歌有Freebase、IBM Waston有DBpedia和Yago、Amazon Alexa有True Knowledge,几乎每个人都接触过的苹果Siri有Wolfram Alpha等等。
    有了知识图谱,大数据分析、语言理解就能更上一个台阶。在发现更多概念和事物之间的关系后,“隐藏”知识将被发现,当然这其中少不了运用图数据库、自然语言处理、机器学习等多方面的技术。
    在未来,知识图谱技术将会增强机器学习的可解释性,将在图卷积辅助图像分类等多个领域发挥出越来越重要的作用。数科星球(ID:digital-planet)将在其后的文章中一一解答知识图谱所涉及的相关领域。
    02
    知识图谱技术正在成为新变量
    在人工智能发展早期,人们希望通过用计算机符号模拟人脑知识并推倒人类的心智,在神经网络中,强调信息传导。现在由于计算机算力和数据量的提升,人工智能的研究取得了长足进步。
    在新的时代下,遥感影像、摄像头、问卷调查、手机信令、GPS追踪等领域以肉眼可见的速度成长。在这个过程中,所谓“多源异构数据”正在呈指数级爆发。
    数据的来源更多了,数据的类型也不仅仅是上个时代喜闻乐见的表格等信息。在这样的趋势下,数据库行业也在发生变革,基础库、主题库甚至专题库纷纷上线,以地理信息、IoT、轨迹数据为代表的时空数据正在得到大面积应用,AP、TP数据库需求显著分化。
    对于企业来说,多源异构数据的处理难度变得越来越高。在制造业中,仪器的检修、采购、运行数据以及产品的销售、退回记录和反馈都会遗留在各种各样的终端之上。在这种情况下,与其将所有数据整理成一个整体,不如将数据之间建立关联,来改善运营现状,而这就是知识图谱更大的应用场景。
    从信息的模糊到准确、从数据的失真到真实,构成了企业在提高效率方面的新闭环,其中不可缺少的就是知识图谱所带来的诸多好处。
    如今的知识图谱产品甚至正在冲击传统ERP市场。在之前,人们已经习惯手动录入数据到数据库,再通过SQL查询。现在,二维表可能被知识图谱取代,割裂在不同领域的知识正在成为一个整体。
    这种整体的知识也正在成为企业新的竞争力体现:如在智能搜索、竞品分析、反欺诈、论文查重和实时舆情分析中,知识图谱都有用武之地。
    一段时间后,随着软件厂商在图数据模型、规则模型和算法模型的进一步积累,各行各业也将出现服务于不同行业的知识图谱产品。至少,已经有不少公司正在这样做。
    03
    知识图谱的未来展望
    客观上,世界拥有不计其数的实体,以人力已无法将实体和概念建立完整的联系,而知识图谱可以弥补这样的空缺。
    目前知识图谱行业还存在一些软肋有待攻破:
    其一,知识图谱对所属行业的业务了解不够透彻,底层技术能力难以覆盖完整的生产流程;
    其二,一些知识图谱公司将太多精力投入在可视化展示之中,而在场景的深度挖掘以及数据积累上还有待提高;
    其三,是行业人才匮乏,技术难以赶上业务需求的增长。
    在不足的另一侧,是行业的迅速增长。艾瑞的咨询报告显示,2021年,知识图谱核心市场规模预计达到107亿元,而到2026年,相应规模将超过296亿元,2021-2026年CA?GR=22.5%。知识图谱成为20%以上增长的行业之一,高速的增长理应引起广大投资者们的重视。
    目前,金融和公安行业已成为知识图谱行业应用最快的垂直行业。在上述两个行业中,企业的投入不遗余力,成为了知识图谱行业增长的不可忽视的动力。在未来,政务+知识图谱的市场将被唤醒,一些行业专家认为,政务的需求同样不可忽视。
    目前,知识图谱的国家标准正在积极筹备中,一些知名企业也在其中起到了重要作用。以达观数据为例,其产品已广泛应用于汽车工业、军事装备、核工业、电力电网、能源、消费电子、通信、集成电路、船舶制造、材料、航空航天、制药、医疗设备、机械装备、矿业、锂电等领。
    回顾知识图谱的发展历史,人们会惊讶于该领域的崛起速度。早期,ConceptNet 5.0也仅包含2800万个RDF三元组关系描述,而现在,这样的数据已超千亿级别。
    *数科星球(ID:digital-planet)出品