引重致远,独立技术研究院三大维度掘进AI

曾响铃

    文 | 曾响铃
    来源 | 科技向令说
    智能化越是深化发展,承担最底层技术创新责任的企业内部AI研究院或类似的部门,就越能表达出一个企业的AI底色。
    例如,不久前,阿里AI实验室被传出关闭,引发业内广泛关注,随后阿里方面予以否认,称只是组织架构调整,它“并入”了阿里云智能,可见阿里可能调整了其AI战略定位。
    这些过去深埋在企业内部、较少出现在聚光灯下的AI研究院们,其身世浮沉、在企业组织架构中的位置,很大程度反映了企业对待AI的价值取向。显然,阿里对AI的定位,开始更加侧重快速、直接的商业价值落地。
    如果是偏重于技术的长期价值,则企业可能长期保持AI研究院或类似部门的组织独立性,这方面,地位不断凸显的百度研究院则较为典型。
    从AI研究院的种种价值表现切入,或许给了我们更好地理解巨头企业AI发展战略的一个可行视角。
    技术研究院们的不同命运,早已注定?
    纵观当下企业内部的技术研究院所处的“位置”,主要包括三种:
    业务板块各自配套:不同的业务条线各自配备技术研发部门,这方面以腾讯为代表,例如微信就有自己的AI部门;
    核心板块的组成部分:技术研究院承担企业全局的底层技术研发任务,但不是独立的机构,这方面以组织变革后的阿里为代表,AI实验室地位降低成为云计算业务板块的附属;
    独立的底层机构:技术研究院作为企业技术发展和创新的统一底层驱动力量来源,地位独立且享有整体化的架构和体系,这方面以百度研究院为代表。
    不同的“位置”,BAT各占一份,而这种不同根本上来源于企业对技术深耕的价值选择。
    美国曾经有一个“施乐研究中心”,先后研发出AIto(第一台个人计算机)、Xerox Ethernet(以太网前身)、图形界面、鼠标,客户端/服务器架构,通信协议……对互联网的发展有着深远的影响,但因为缺乏外部资源支撑等原因最终破产,这说明,底层技术的创新向来是一件引重致远的事,负载沉重而到达远方。
    从这个角度看AI底层技术的研发和突破,它伴随的是长时间的静默,需要对技术的预判,在高瞻远瞩下能够隐忍短时间内看不到回报的现实,进行长期的成本和资源投入,而这就是“技术信仰”的体现,它的强烈程度不同,会决定AI研究院们的“命运”不同。
    2013年初,百度董事长兼CEO李彦宏决定成立了世界第一个深度学习研究院IDL,这成为百度研究院的前身,目前,百度在这上边已经持续投入了8年,其背后,还有百度在AI方面长达11年的投入。
    在NLP、CV等领域,百度都在成为国内AI的开拓者和领军者,源源不断输出前沿技术创新,既服务企业内外部发展,也在行业层面成为AI领军者。
    与施乐研究中心相比较,百度研究院是幸运的,它拥有百度在技术信仰下的不计短期回报的持续输血,因而可以长期持续地研究那些前瞻性、方向性、引领未来的技术,面向星辰大海。
    不过,需要强调的是,把AI研究院摆在什么位置,取决的是企业对技术与商业化关系的导向选择,它没有根本上的对错之分。在整体并入阿里云智能后,阿里AI实验室就声称已经孵化了全息店铺、天巡机器人等产品,直接挂钩商业应用,这对阿里来说,也未尝不是最好的选择。
    引重致远,独立技术研究院三大维度掘进AI
    仅从希望AI技术实现更多创新突破的朴素视角看,企业内部独立的AI研究院应当是AI更好地实现引重致远的载体。
    以百度研究院为案例,这种载体价值,体现在三个方面。
    1、技术研究本身,可以构建立体化的研究体系
    坚定的支持、持续的投入,让AI研究院可以在AI技术方面形成体系化而非碎片化的研究体现,实现全面的技术创新突破。
    根据2020年11月国家工业信息安全发展研究中心、工信部电子知识产权中心发布的《2020人工智能中国专利技术分析报告》,在人工智能专利申请量和授权量方面,百度以9364件专利申请和2682件专利授权处于第一位,这也是百度连续三年在该报告中总申请量蝉联第一。
    此外,百度还在CVPR,ACL,ECCV等顶级学术会议上发表了260多篇论文,在30多个竞赛中名列前茅。
    如果在底层技术层面再进行由深到浅的划分,百度研究院在技术方面的探索,大致包括实现整体闭环的三个层面。
    首先,是非常前沿的技术探索方面,2020年,百度发布了国内首个云原生量子计算平台量易伏Quantum Leaf,同时量子脉冲计算服务量脉Quanlse、量子机器学习工具集量桨Paddle Quantum也获得全面升级,开启了属于中国的量子时代。2020年4月,Analytics Insight公布了2020全球十大量子计算公司名单,其中包括埃森哲、亚马逊、谷歌等巨头企业,中国两家公司上榜,百度是其中之一。
    然后,还有AI基础技术研究方面,百度研究院在多模态(即让机器像人类一样具备理解和思考的能力,这需要融合语言、语音、视觉等多模态的信息,而非单一认知能力)方面有较大突破,多模态模型ERNIE-ViL登顶视觉常识推理权威榜单VCR;以及对话智能方面,发布超大规模开放域对话生成网络PLATO-2,端到端问答方面提出RocketQA等等。
    在应用型技术方面,百度则将AI技术广泛与现实需要相结合,出产大量快速部署的新技术应用。典型的如针对疫情,其开源的线性时间算法Linearfold,提供了世界上现有最快的病毒RNA二级结构分析能力;服务于流动人口密集场所的AI测温,在两个月检测2700万人次;智能外呼系统帮助基层社区群防群控支持随访500万次,等等。总体而言,在智能语音、机器视觉、NLP、知识图谱、深度学习等多个领域,百度的AI都在出产大量技术应用。
    2、产业应用协同,可以形成从技术传导至业务的统合体系
    独立而自成体系的AI研究院,很容易与企业整体多种业务产生协同,形成全局化的AI应用落地。
    在百度研究院不断“出产”技术成果的基础上,百度构建了百度大脑、百度智能云的“云智一体”,对外深度赋能产业智能化。
    百度AI技术经过多年的积累,通过百度智能云以清晰化的路径走向全场景产业落地,也获得更广泛的认可。在金融产业,AI加持下,百度智能云已经服务了近200家金融客户,其中包括国有6大银行、9大股份制银行、21家保险机构,涉及营销、风控等十几个金融场景。其中,百度合成虚拟形象技术实现了可量产的真人形象虚拟人,与浦发银行共同打造了业内首个“金融数字人”此外,百度的未来银行解决方案还率先落地百信银行,打造未来银行体验店。
    目前,百度智能云智能制造解决方案已经覆盖14大行业,100多家客户和30个合作伙伴,触达50多类垂直场景,在3C、汽车、钢铁、能源等行业已规模落地。2020年年底,百度与贵阳市政府正式签署战略合作协议,将承接贵阳经开区工业互联网项目建设,助力贵阳打造3个千亿级产业集群。
    在能源领域,百度智慧能源已覆盖电网、发电、新能源、清洁能源、石油、化工等场景。基于能源AI中台,国家电网山东电力公司快速搭建起属于自己的AI中台,AI快速落地在各个业务场景,例如输电通道可视化平台,帮助实现户外各种复杂场景下的安全巡检。
    此外,还有智慧医疗服务300+家医院和1500+家基层医疗机构等多产业落地成果,等等。
    可以说,从百度研究院到百度大脑到百度智能云,AI技术创新不断被挖掘,然后以流畅的通路最终走向了产业应用,推动各行各业智能化升级加速。
    3、行业探索引导,不仅推动百度突围也引导行业前路
    经过持续一年的总体上扬,到目前为止,百度股价已经突破800亿美元,这其中,对AI技术发展和落地应用的信心是重要驱动力量。
    多年的“隐忍”让百度正在迎来以技术为能力核心的商业价值爆发,百度在产业智能化、自动驾驶等方面的生态不断丰富,口碑持续向好,而对向来看重市场领导力量的资本而言,百度在行业层面的“领头羊”地位更加重要,这种认可最终又回到百度研究院对整个AI发展所起到的作用上。
    百度研究院不仅在推动百度技术深耕和价值突围,还代表AI不断突破,引导前路,承担对应的行业领导者责任,一些时候,它所探索的技术成果,不仅是百度的突破,也是整个AI领域的突破。
    这种地位,从权威趋势预测也可见一斑,每年,百度研究院的趋势预测都颇受行业关注,对2020年科技趋势的预测所提到的技术、产业方向都在一一应验,1月13日百度研究院又发布了2021年十大科技趋势预测,包括数字人、交通产业、AI芯片等内容,试图为行业树立清晰的技术路标,挖掘和洞察新的机遇,科技领域的头部平台地位进一步彰显。
    回过头来看,在一系列“动荡”后,企业AI研究院中能够承担起这种职责的,可能也只有百度研究院了。
    从企业价值到国家价值,技术研究院成为联动的触点
    前段时间,因为在社区买菜这件事上闹哄哄的争抢,从官方到民间都对互联网企业们大量资本投入盯住团购、买菜等业务有些想法,业界形成了一种共识,科技公司更应该关注星辰大海。
    前沿技术的探索和发展,即可以是一家公司的发展基础,在宏观层面,又何尝不是整个国家的“立身发展之本”、发展基石。
    换句话说,一个国家的技术竞争力是宏观的概念,它最终落实到的可能还是科研机构、企业们的各种自有的技术上,例如华为的5G,百度的AI等等,而最终,这种落实,到达的是企业内部的技术研发部门身上。
    AI研究院作为企业AI能力的底层来源,同样是国家AI竞争力的来源之一。多年来一直秉持技术信仰,和对未来技术发展的信念,百度开始收获企业价值,同时也成为中国技术力量的代表,勇于到国际上去竞争。
    2020年底,百度飞桨对外发布了开源框架V2.0RC版,提供“编程一致、动静统一”的全新开发体验,新框架下,深度概率编程、量子机器学习等前沿学术研究将获得更好的支持。飞桨还推出业内首个通用异构参数服务器架构,可以大幅提升训练效率,节约成本,开源算法库也实现全面升级,官方算法数量从140+扩展至200+,而飞桨的硬件生态伙伴则达到了20家,适配或者正在适配的芯片/IP型号达到29种。有权威科技媒体通过分析GitHub上的开源项目数据集GitHubArchive得出2020年度全球深度学习框架排名榜单,百度飞桨已经超越谷歌TensorFlow,紧随Facebook?PyTorch之后:
    
    在芯片领域,2020年百度发布了自研的AI芯片百度昆仑2,采用7nm先进工艺,较2018年的百度昆仑1提升3倍,且与飞桨实现了软硬件一体的深度适配,2021年上半年即将量产。
    此外,还有百度首款针对远场语音交互研发的百度鸿鹄芯片落地应用,其在小度智能音箱2红外版上的应用,使得语音唤醒率更高、识别错误率大幅度降低、功耗相比传统芯片下降90%。
    这些,都直接代表了中国AI技术能力的竞争优势和潜力。
    总而言之,从硬件芯片,到软件算法,到技术与业务框架体系,到产业应用落地,从百度研究院起始,百度AI在2021年开启的关口,已经完成了完备的体系化构建和业务路径打通,既具备AI深度创新能力,也能让AI快速走向产业应用,惠及千行百业,推动宏观产业升级和社会进步。