复盘百度AI十年历程:属于百度AI的时代已经启幕

Alter聊IT

    3月23日的演讲中,李彦宏将回港上市定义为百度的“二次创业”。
    对于百度来说,“二次创业”的说法绝非虚辞。2005年冲刺纳斯达克时,百度还是一家纯粹的搜索引擎企业;时隔十六年后帮助百度叩开港交所大门的,则是深耕了十年之久的人工智能,百度已经彻底成为一家AI生态型企业。
    犹记得在2019年5月举办的第二届数字中国建设峰会上,李彦宏在阐述百度AI的愿景时打了一个形象的比方:“互联网是前菜,它的特点是快;人工智能才是主菜,需要温火慢炖,但营养丰富。未来没有一家企业可以声称与人工智能无关,吃不到这道主菜,将失去一个时代。”
    借着百度二次上市的契机,似乎有必要重新梳理下百度AI的十年历程,如何从不被外界注意的新事物,逐步蜕变为百度的第二增长引擎,并帮助百度提前锚定了人工智能时代的市场站位。
    鉴于篇幅的原因,本文主要分为四个章节。
    01 育种
    2009年,神经网络专家Hinton和他的两个研究生将神经网络应用于语音的声学建模,与行业内流行了30年的标准工具一较高下,在小词汇量连续语音识别数据库TIMIT上,获得了语音识别竞赛胜利。
    于是深度学习像是打开了闸门的洪水,迅速从语音识别、图像识别延伸到机器翻译、语义理解等领域,极短的时间里就成了学术圈的主流。彼时中国互联网还处于PC时代,流量红利犹在,太平洋对岸的热闹未能触动太多企业,人工智能的应用还只是停留在科幻电影里的虚幻场景。
    百度可能是国内最先“觉醒”的互联网巨头,在2010年初率先成立了“自然语言处理部门”,尽管最初的目的是为了服务搜索中产生的智能化需求;接下来不断在语音、图片等技术上布局,并敲定了在知识图谱技术上长期投入的战略。
    到了2012年的时候,百度的AI战略已经初步成型,陆续成立了深度学习研究院IDL、人工智能实验室。2014年百度开始涉足智能驾驶领域,先后推出了深度语音系统、百度大脑、度秘、 Apollo 自动驾驶平台等技术体系,涉及自然语言处理、机器翻译、语音、视觉、机器学习、深度学习、知识图谱等核心技术。
    也正是从2010年开始,百度的研发费用进入稳步增长期。研发投入在营收中的占比,从早期的不足10%跃升到 2020 年的 21.4%,十年间的累计研发费用高达 1023 亿元。甚至有好事者进行过这样一组对比:2010年进军人工智能后,百度的营收增长了14倍,研发费用的增长却超过25倍。
    上千亿的研发资金似乎并未直接利好百度的营收,但带来了远比一时的利润更有价值的硬实力:
    根据国家工业信息安全发展研究中心发布的《2020人工智能中国专利技术分析报告》,在人工智能专利申请量和授权量方面,百度以9364件专利申请和2682件专利授权位居第一,并在深度学习、智能语音、自动驾驶等领域占据首位。
    仅在2020年期间,百度被国际AI顶会收录的论文达到260多篇,在CVPR、ECCV、NeurIPS、INTERSPEECH等全球顶级的人工智能学术会议或相关竞赛上,百度AI问鼎冠军近30次,斩获了100多个行业权威奖项。
    沉甸甸的数字背后,百度就像是一位劳作在田间地头的“育种师”,亲手开辟了一块又一块的试验田。在外界沉迷于追逐风口疯狂扩张的时候,百度的速度看起来有些“落后”,但育种师清楚的知道这些种子的价值在哪里
    02 散播
    2016年,人工智能的浪潮终于走出学术圈。在某场著名的公关事件后,人工智能逐渐成为大家茶余饭后的谈资。或许很多人对人工智能的应用依旧陌生,但人工智能的进化速度彻底刷新了人们的传统认知。
    原本痴迷于移动互联网船票的中国企业逐渐意识到,属于人工智能的时代已经不再遥远,倘若和新的技术浪潮失之交臂,结果可能是灾难性的。现实的残酷在于,根据第一财经等主流媒体的报道,中国AI人才的缺口可能有500万的规模,并将随着人工智能的产业化进程逐年增长。
    百度开始有意调整自己的姿态,从默默深耕的“育种师”,思考怎么将前沿的人工智能技术散播出去,避免重复造轮子等问题。
    2016年9月的百度世界大会上,集视觉、语音、自然语言处理、知识图谱、深度学习等技术于一体的百度大脑正式对外开放,并且每隔一段时间就会进行迭代,合作伙伴可以直接调用百度AI的核心能力。
    同样是在2016年,百度主导的深度学习框架PaddlePaddle(飞桨)上线,涵盖了深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件,填补了中国开源深度学习框架的空白。
    在云计算的战场上,百度率先提出了“ABC”战略,将人工智能(AI)、大数据(Big Data)和云计算(Cloud)融合在一起,将视觉、语音、语义理解等擅长的AI能力通过云计算服务带到了企业级市场。
    即便是不被外界重视的人才培养方面,百度在2016年与西安交通大学联合开设了人工智能班,与中科院大学在人才培养、科学研究、数据开放、资源共享等方面达成合作,开启了产学研一体化的篇章。
    数据再一次证明了百度的远见。
    目前百度大脑已经对外开放270多项AI能力,日调用量超过1万亿次;百度飞桨凝聚了265万开发者、服务了10万家企业、创建了超过34万个模型;截止到2020年底,百度总计为社会培养了超过100万AI人才……
    更加有说服力的是百度创新的业务孵化。2016年之前百度的业务主要集中在移动互联网的领域,目前已经形成了以AI为核心的生态布局。比如信息流已经是百度移动生态的核心组成,小度的月交互次数已经达到75亿次,Apollo旗下的Robotaxi和Robobus在国内多个城市接待的乘客数量已经超过21万。
    回头来看,将AI的种子散播出去注定了百度作为AI生态型企业的定位,毕竟技术只有落地才能发挥其最大的价值。
    
    
    1  2  下一页>