中国公共数据开放图谱

零壹财经

    来源 | 零壹财经
    作者 | 赵越
    国家“十四五”规划在“提高数字政府建设水平”一章,提出要“加强公共数据开放共享”,并指出要“探索将公共数据服务纳入公共服务体系,构建统一的国家公共数据开放平台和开发利用端口”“开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用”。
    公共数据是数字经济时代的重要性基础资源之一。在确保安全的前提下,将公共数据开放,能够使“沉睡”的数据被应用起来,有利于数据价值的释放。
    2021年以来,广东、江苏、江西、浙江等地先后出台了专门面向公共数据领域的法律规范。2022年2月,山东更是专门出台了《山东省公共数据开放办法》,直接对公共数据开放进行规范。
    数据公共的开放、开发和利用已经成为各地发展数据产业的重要环节。那么,什么是公共数据?各地公共数据的开放现状如何?又是如何进行开发和应用的?
    一、公共数据的定义及相关政策
    明确公共数据的定义和范围,是推动公共数据开放的第一步骤,也是重要步骤。
    早在2015年8月,国务院发布《促进大数据发展行动纲要》,就已经提到“稳步推动公共数据资源开放”。之后,相关部门又发布了一系列相关政策,其中提到了“政务信息开放”“政府信息开放”“政务数据开放”“政府数据开放”等内容。
    表:国家发布的公共数据开放相关政策
    
    资料来源:零壹智库根据公开资料整理
    目前,关于公共数据、政务数据、政府数据,全国并无统一定义。综合各地数据相关政策中的定义看,公共数据的范围最大,其次为政务数据,政府数据的范围最小。但从部分地区制定的数据管理办法看,公共数据和政务数据的边界正逐渐模糊。
    据零壹智库不完全统计,从省级层面看,目前,北京、天津、吉林、上海、江苏、浙江、江西、广东、海南9个地区已经专门针对公共数据出台了管理办法。山西、内蒙古、辽宁、安徽、福建、湖北、贵州、宁夏8个地区则出台了政务数据管理办法。
    综合以上9地出台的管理办法中对公共数据的定义,公共数据是指国家机关、事业单位,以及其他依照法律法规授权具有管理公共事务职能或提供公共服务的组织在依法履行公共管理职责或者提供公共服务过程中收集和产生的数据。此外,《江苏省公共数据管理办法》还要求公共数据是对具有公共使用价值的信息的记录。
    公共数据公开指公共管理和服务机构在公共数据范围内,面向社会提供具备原始性、可机器读取、可供社会化再利用的数据集的公共服务。
    据零壹智库不完全统计,目前上海、浙江、天津、山东、广西、重庆和贵州等7个地区已经发布专门面向公共数据开放领域的管理办法。其中,2019年10月,上海正式实施《上海市公共数据开放暂行办法》,这是全国首部公共数据开放的专门地方政府规章。
    二、各地公共数据开放现状
    数据开放平台是公共数据开放的重要载体。复旦大学的中国开放数林指数网站显示,截至2021年10月,我国已有193个省级和城市的地方政府上线了数据开放平台,其中省级平台有20个(含省和自治区,不包括直辖市和港澳台),城市平台 173 个(含直辖市、副省级与地级行政区)。
    2017年5月,国务院办公厅在《政务信息系统整合共享实施方案》中提出,要加快公共数据开放网站建设。自此,全国地级及以上政府推出的数据开放平台数量出现明显增长,从2017年20个增长到了2021年10月的193个。
    图:历年地级以上平台数量增长情况
    
    数据来源:中国开放数林指数网
    (一)平台建设由东部向西部逐步扩散
    从上线时间来看,总体上,我国公共数据平台建设呈现出从东部逐渐向西部扩散的发展趋势。
    从平台数量看,目前,所有的直辖市以及浙江、广东、山东、四川、广西等省域内所有下辖城市都已经上线了公共数据开放平台;安徽、湖北、湖南、贵州、黑龙江等地的平台数据量也不断增长,正逐渐由“点”成“片”;甘肃、福建、河北、河南及陕西等地虽上线了省级平台,但省内大多数城市未上线平台;此外,吉林、云南的省本级及下辖地区均未上线任何数据开放平台。
    图:历年地级以上平台数量地理空间分布
    
    数据来源:中国开放数林指数网
    (二)公共数据开放发展不平衡,北京、山东、四川等地开放程度高
    为了展现各地公共数据平台的运行情况,零壹智库对直辖市及各省的省级公共数据开放平台的数据开放方式、开放数据量等进行了进一步分析。
    这些平台的数据开放方式主要包括数据集和数据接口两类,其中,数据集的格式包括xls、xml、json、csv、rdf、链接以及word、pdf、图片等格式。
    从数据量上看,各个地区开放的数据集、数据接口及数据总量存在明显差距。综合来看,北京、山东、四川、浙江和上海的公共数据开放程度较高。值得注意的是,从现有的公开数据看,山东是开放数据接口最多的地区,达6.96万个,开放的数据条数也仅次于北京,为48亿条。
    表:各地区的公共数据开放平台
    
    数据来源:零壹智库根据公开资料整理
    注:以上排序以数据条数为第一考量因素,其次为数据接口,最后为数据集,其中“/”表示未查询到相关数据。
    三、公共数据的开放目录与应用
    目前,国家并未出台专门政策文件公布公共数据开放目录。2018年,网信办、发改委、工信部联合发布《公共信息资源开放试点工作方案》,要求重点开放信用服务、医疗卫生、社保就业、公共安全、城建住房、交通运输、教育文化、科技创新、资源能源、生态环境、工业农业、商贸流通、财税金融、安全生产、市场监管、社会救助、法律服务、生活服务、气象服务、地理空间、机构团体等领域的公共信息资源。
    从各地的数据公开目录看,虽各地制定的数据开放目录略有差异,但开放的数据仍主要围绕以上领域。此外,自新冠肺炎疫情暴发以来,各地公共数据开放平台将医疗卫生相关的数据作为了开放重点,部分平台还开放了疫情数据专题。
    应用方面,目前数据创新创业大赛成为部分地区创新公共数据应用的重要方式,上海、浙江、山东等都已推出了数据开放创新应用大赛。此外,为扩大数据开放应用生态,上海汇集多家研究机构、高校、企业等推出了面向城市管理、交通、教育、金融等11个领域的大数据联合创新实验室;山东推出了数创沙龙活动;贵州建立了专门的企业生态等。
    从应用数量看,根据零壹智库不完全统计,在直辖市及各省级的公共数据开放平台中,14个地区的公共数据平台已经推出了相关数据应用。其中,广西的数据应用最多,有140个;其次为北京,有107个;山东和广东分别由105个和102个。数据应用类型包括移动应用、web应用、小程序、分析报告和创新方案。
    图:直辖市及各省级的公共数据开放平台的
    数据应用数量
    
    资料来源:零壹智库根据公开资料整理
    从应用领域看,以上地区推出的数据应用涉及了政务服务、金融服务、交通出行、医疗卫生、教育科技、文化休闲等多个领域,其中金融服务、交通出行两大领域的关注度较高。
    金融服务
    金融业是公共数据的重要应用领域。在服务中小微企业的过程中,公共数据的应用有助于银行完善中小微企业的信用画像,降低信贷成本,控制不良率。目前,北京、上海、山东等地公共数据平台均已发布了金融相关应用。
    以上海公共数据开放平台为例,其通过从法人库、高院、税务、人社局、住建委、规资局、环境保护局和科委的系统中抽取公共数据,汇聚至公共数据开放平台,然后将数据进行分析和治理,形成主体数据集。数据集通过开放网关将数据传送到至银行业务系统。银行的风控模型获得公共数据后,通过人工智能的手段分析企业的盈利能力、偿债能力、营运能力、上下游业务经营状况、员工福利等维度,识别好坏企业,针对规模和现金流测试企业贷款额度。
    图:上海市公共数据开放普惠金融行业应用
    
    资料来源;上海市公共数据开放平台
    交通出行
    在交通出行领域,以北京为例,北京市交通委员会采取政企合作模式,向高德地图、百度地图、美团、滴滴出行、腾讯地图等一体化出行服务平台开放了涉及社会出行服务相关数据。各平台基于开放数据积极完善平台服务功能,上线了实时公交查询、地铁公交满载率查询、出行方案综合规划、未来出行用时以及绿色出行碳激励等功能。
    四、总结
    近年来,国家对公共数据开放日益重视,各地政府也有序上线了公共数据开放平台。但总体看来,我国公共数据开放仍处于初始阶段。公共数据的类型和边界仍需明确,数据开发和利用的能力有待提高。如何释放更多有价值的公共数据,实现数据资源的灵活协调,真正让公共数据活起来,用起来仍有很长的路要走。