北京人才地图来了!北京成全国最顶尖人才聚集高点

学术头条

    北京是世界著名的历史文化古都和现代化国际大都市,同时,北京也是全国最顶尖人才聚集的高点。
    科技人才是国家科技创新经济发展的首要驱动力,也是实现中华民族伟大复兴的关键因素。如何发现、培养、留住、吸引、使用人才,是在当今日趋严峻的国际竞争中取得优势的重要课题。
    众所周知,过去三十年,作为经济、政治中心的北京集聚了全国乃至全球各地优质学者人才,不断推动着北京综合实力和核心竞争力的增长。
    今天,学术君就带领大家一起通过 AI+大数据,详细了解一下北京的人才现状和实力。
    通过北京市智慧人才地图(图1)可以看出,北京市人才整体分布与发展情况上,遥遥领先于全国其它重点城市。
    
    图1:北京市智慧人才地图
    具体而言,北京市云计算、人工智能、大数据和物联网四个领域的高层次人才总数为 2995 人(四个领域高影响力期刊中近 10 年发文的学者数量),远超其它一线城市。
    其中,云计算领域的高层次人才凝聚数量最多,为 878 人(该领域高影响力期刊中近 10 年发文的学者数量,下同);人工智能领域的高层次人才聚集数量为 845 人;大数据领域的高层次人才聚集数量为 679 人;物联网领域的高层次人才数量为 593 人。
    此外,从图1可以看出,北京市 92% 的重点领域高层次人才集中在海淀区,从所属高校/机构来看,清华大学、北京大学和北京邮电大学占据北京人才机构排名前三。
    分领域来看,在人工智能领域(图2),北京市的人才健康指数为 92.8,在全国排行第一。
    
    图2:北京市人工智能领域人才指数
    其中,地区影响力对比中,北京市与其它城市相比,在产业创新研究和产业创新影响力上较为突出;从分布区域上看,人工智能领域人才主要集中在海淀区,清华大学和北京大学在该领域人才数量最多、成果数量最大;“机器学习”“无监督学习”“语音识别”等关键词是该城市该领域的科研热点。
    在大数据领域(图3),北京市的人才健康指数为 95.2,在全国排名第一。
    
    图3:北京市大数据领域人才指数
    其中,从区域分布上看,北京市的大数据领域人才主要集中在海淀区与朝阳区;在大数据领域的人才机构排名中,清华大学和北京大学同样领跑一众机构;“数据库”“数据流”“数据立方体”等关键词揭示了北京市大数据领域的研究热点。
    在云计算领域(图4),北京市的人才健康指数为 90.2,在全国排名第一。
    
    图4:北京市云计算领域人才指数
    其中,地区影响力对比中,北京市在产业创新影响力上较为突出,而基础科研影响力方面相对弱一些(但强于其它城市);从区域分布上看,北京市的云计算领域人才主要集中在海淀区;在大数据领域的人才机构排名中,清华大学在该领域人才数量最多、成果数量最大;“P2P 分布式”“虚拟桌面”“企业混合云”等词是该城市该领域的研究热点。
    在物联网领域(图5),北京市的人才健康指数为 91.3,在全国排名第一。
    
    图5:北京市物联网领域人才指数
    其中,地区影响力对比中,北京市在产业创新影响力和产业创新上较为突出;从区域分布上看,人才主要集中在海淀区和朝阳区;在该领域的人才机构排名中,清华大学、北京大学和北京邮电大学名列前茅;“无线通信”“商业智能”“传感器”等词是该城市该领域的研究热点。
    人才地图的智慧之处
    《智慧人才地图》是智谱·AI 借助科技情报大数据挖掘与服务系统平台 AMiner,构建的超大规模多研究领域知识图谱,基于场景提供学者的智能匹配服务的智慧人才系统。
    系统利用数据挖掘和社会网络分析技术,从海量文献及互联网信息中获取信息并进行语义抽取和隐含关联关系挖掘,构建全球全领域学者库人才网络,为学者、机构、企业等提供人才搜索、论文搜索、学者社会网络关系识别、学者能力图谱等多样化功能。
    而且,智慧人才系统提供基于大规模知识图谱的人才语义检索,智能理解用户查询的语义信息,自动从学科领域、人才姓名、研究兴趣、就职单位等多个维度对系统提供的专家智库进行快速而准确地检索,准确定位用户寻找的专家人才,并提供多维度人才语义属性的快速过滤和智能排序。
    除了自能的语义检索外,产品还为用户提供了专家/智库的收藏,以及对开通智库的浏览,从不同功能入口帮助用户快速找到目标专家。
    智慧人才系统的亮点包括:
    以大数据技术为核心,构建超大规模多研究领域知识图谱,基于场景提供学者的智能匹配服务;提取基于各地区、研究领域的人才指标,对人才结构、发展目标等多维度进行分析和预测,提供对人才数据的可视化展示,实现对学者的「按图索骥」;产品采用 SaaS 模式下的微服务架构,可对于业务需求的变更进行快速响应和快速部署,实现对业务扩展的及时支持。
    正如前文展示,智慧人才地图能够给出北京市人工智能、大数据、云计算、物联网等等热点领域的多方面信息。所呈现的数据点面结合,既包括北京该领域的人才动态、城市人才分布、北京人才机构排名,也有该领域的全国人才分布、全国发展情况以及北京与全国其他省会城市的影响力对比。
    
    图:智慧人才地图“人才健康指数”和“人才分布地图”功能介绍
    
    图:智慧人才地图“本地人才核心领域/行业”和“人才动态”功能介绍
    
    图 :智慧人才地图“人才态势分析”功能介绍
    此外,科技情报大数据挖掘与服务系统平台 AMiner 还结合人工智能学术知识图谱,深度挖掘了目前北京各个领域学者的职业生涯信息。
    感兴趣的读者可以访问 AMiner 平台进行查看。
    智慧人才系统算法解析
    那么,这么详细、可视化的人才地图,是怎么做出来的呢?
    智谱AI人才地图的研发团队表示,该智慧人才系统依托清华大学高质量大规模知识图谱、深度隐含关联挖掘算法和认知图谱等核心技术,服务地方科技产业发展,展示符合地方发展方向的本地、全国和全球人才分布态势、人才流动趋势,可以为地方人才引进工作中的寻、评、引、用提供基于大数据的智能化支持,构建全球人才 Global Positioning System,实现人才工作的按图索骥。
    在算法使用上,智慧人才地图主要使用了人才指数算法和两种城市人才分析方法。
    人才指数算法:
    该算法模型是一种机器学习+专家经验的集成模型,内层根据学术人才评价指标特点分别采用使用 LR,SVM,深度神经网络等机器学习算法。利用 AMiner 人工标注的不同领域、多层次学术机构的大量高质量学者数据库作为模型训练数据。在此基础上,外层封装专家知识的经验模型,组合而成城市人才评分模型。
    为使该算法达到最优计算效果,该模型的训练采用了启发式规则+模型自主学习的联合算法,优化目标值也是从大量经过提纯的学者数据中,经过统计分析得到的。
    这样得到的算法模型,结合了大数据分析和专家先验知识,从而达到合理精准评分。
    而计算城市人才指数得分的过程,就是将人才该城市的人才指标特征(顶尖学者发文数之和,学者数,h之和,引用数之和等),输入到模型中,会得到所属的层级分类和具体得分,这个得分可以理解为和高等级的学术团体之间的差距。
    城市人才分析方法:
    针对需求领域类型的不同分别采用以下2种方法:
    1.针对较为专业的领域方向,且和其他领域交叉较多,采用学者标注算法进行人才分析;使用2类算法对学者进行领域分析标注:
    a. AMiner 学科知识图谱:对学者的发表论文中的实体,关系等信息进行抽取(其中实体抽取方法使用 BERT+CRF 和规则,关系抽取采用多种方式结合:包括规则和远程监督),再利用已构建的学科知识图谱推理对学者进行领域标注。
    b. 领域标注系统:这是一个以深度学习为核心算法的多标签标注系统,算法网络结构简单说明:先用 bert 对学者多篇代表性论文进行 Emmbedding,再使用多个的局部 Attention 层和全局 Attention 层进行特征的融合和提取,最后基于这些语义特征向量进行标签预测,即对学者进行领域的标注。
    2.针对于相对独立的学科领域采用 AMiner 会议期刊库(包含大约 4 万个期刊会议)进行人才筛选分析;流程如下:专家标注期刊/会议→期刊/会议影响力排序→学者筛选→学者学术水平排序。
    参考资料:智谱.AI 智慧人才地图