百度之星变身“造星工厂”,中国AI人才培养的新路径

Alter聊IT

    10月15日,百度之星迎来了自己的第15个颁奖礼。
    与往年最大的不同,可能就是00后在本届百度之星的表现,程序设计大赛排名前10的名单中,00后占据的席位有9个之多,其中来自杭州学军中学的00后选手张哲宇同学一举摘得程序设计大赛桂冠。
    当整个社会都在讨论AI人才缺口的时候,00后们在百度之星赛场上的出色表现,不失为一个好消息。
    中国AI的星星之火
    把时间退回到2005年,彼时在校大学生们还在学习C语言等基础的编程课程,互联网世界里发生了什么,整个社会需要什么样的人才,大多数学生无暇思索,或者说缺少接触前沿技术的窗口。
    这一年的百度成功登陆纳斯达克,开启了搜索引擎的商业神话。也正是在这一年,百度启动了首届百度之星程序设计大赛,开启了技术界的“奥斯卡”。
    根据百度官方公布的消息,来自国内外960所学校的10885名同学报名了今年的百度之星程序设计大赛,1865支队伍报名了百度之星开发者大赛。如果把时间轴拉长一些,过去15年中报名百度之星的人数超过20万人,仅2012年就有3.2万人参赛,成为全球规模最大的在线编程比赛。
    每每谈到AI人才的时候,外界已经习惯于将百度比作国内AI界的“黄埔军校”。按照这样的标准,每年一度的百度之星可谓是中国AI界的“造星工场”。
    连续在2005年和2006年蝉联百度之星程序设计大赛总冠军的楼天城,被公认为中国大学生计算机编程第一人,因为经常一人单挑一个队的“战力”,被清华的同学们称为“教主”,毕业后曾在谷歌和百度美研研究机器学习和无人车,已然是人工智能领域的“顶级大牛”;
    还在读高三就参加百度之星的唐文斌,后来考入清华大学姚期智实验班,在2011年与印奇、杨沐一同创办了旷视科技,并出任旷视科技的CTO,被誉为国内人工智能领域的领军人物之一;
    曾经在2016年拿到百度之星冠军的黄宇扬,初中时就开始编程,大学四年每一年都有参加百度之星,并在大四那年得偿所愿。四年的比赛经历,让黄宇扬对语音识别、语义理解等技术有了深刻的理解,如今在ThinkForce担任深度学习框架开发工程师,被认为是人工智能领域的明日之星。
    事实上,从百度之星走出的AI大牛远不止这些,第四范式创始人戴文渊、被技术宅膜拜的编程圈红人唐飞虎、被姚期智院士赞为“姚班研究人工智能理论翘楚”的乔明达……百度之星还在持续输出穿行于AI世界里的“别人家的孩子”。
    工程师的赤子之心
    当转型AI成为一种政治正确的时候,一场人才争夺的“暗战”早已上演,要么花大价钱从友商那里挖角,要么通过内训等方式培养“嫡系”。
    比如谷歌在2017年提出了“忍者计划”:一项不同寻常的内训项目,给予各个部门一定的候选名额,经过层层筛选后选出“忍者”参与培训,目的是让所有产品都提升智能化程度,扩大内部精英人才的储备,甚至让机器学习成为谷歌员工必备的技能;
    比如Facebook创建了AI Academy,对内部员工进行免费的AI技能培训,涉及深度学习、卷积神经网络、循环神经网络、强化学习等多种技术,员工在课程完成后,还可以到FAIR中进行一到两年的项目实践,形成了军校式的人才培养方案;
    再比如英伟达的深度学习学院,与Udacity、Coursera等在线编程教育合作推出线上课程的同时,还定期举办线下课程,似乎在践行黄仁勋“培养出10万深度学习从业者”的计划。然而英伟达的一切行为,都以“让GPU更好卖”为最终目标。
    相比之下,百度之星的人才理念有些“另类”。
    正如百度首席技术官王海峰在2019年百度之星颁奖现场的发言:“百度之星已经15岁了,历届参加百度之星的同学们,无论是否获奖,都走出了自己非常精彩的人生路,在各自岗位上成为佼佼者,甚至领军人物。”有别于商业领袖们深思熟虑的“算计”,从王海峰等百度工程师身上看到的是拳拳赤子之心。
    回顾百度之星15年的历史,2005年到2010年的赛题都指向了当时互联网产业的痛点,意在培养选手们投身产业洪流的能力;2010年以后的百度之星开启了全民编程时代,希望让编程成为一种大众化的技能;2015年人工智能的浪潮兴起后,百度之星果断切换到人工智能的赛道,赛题连续多年聚焦AI算法,并配合双轨人才的需要,增加了团队配合的“开发者大赛”。
    对于一个企业来说,如何尽可能多的提升自身的人才优势,可以说是所有管理者需要思考的问题。可上升到国家的层面,人工智能竞赛的本质还是人才的比拼,通过一场比赛的形式,为莘莘学子们指明方向,加速中国优秀AI人才的成长,何尝不是一个技术工程师心中的家国情怀?
    00后们钓胜于鱼
    关于AI人才短缺的话题,毕马威调研了5家拥有成熟AI技术能力的公司,给出的结论是:这些公司平均拥有375位从事相关领域的员工,每年至少费了7500万美元用于AI人才的雇佣和培养。
    面对这样一份账单,估计不少企业的管理层会有些焦虑,一旦错过了人工智能的浪潮,可能直接左右一家公司的市场前景,想要规避被淘汰的宿命,为数不多的路径可能就是“砸钱”,或是吸纳人才,或是为技术买单。比如麦当劳刚刚在9月份以3亿美元的代价收购了一家AI语音公司,也是这家快餐巨头在今年的第三笔技术投资。
    所幸,00后们在百度之星上的表现,可以让不少传统企业的老板们松一口气,毕竟可以从中看到两个有利信号:
    一是新一代年轻人技术素养的提升。2015年到2019年连续四届百度之星上,本科生参赛者累计超过36000人,中学生的数量也突破3600人次,编程对于新一代年轻人来说早已不再陌生。百度之星程序设计大赛中排名第二的毛嘉怡就是一个例子,小学一二年级就开始在电脑上玩打字游戏,并逐渐走上了编程之路。
    二是开源工具的易用性和低门槛。今年的百度之星首次在两项比赛中设置了应用飞桨深度学习开源平台(PaddlePaddle)的赛题。特别是在程序设计大赛中,参赛选手需给出相应的计算或通信调度顺序,打败飞桨中的基础调度算法,并尽可能提升调度效率。而从00后们“统治”赛场的结果来看,飞桨的易用性功不可没。
    据数据分析公司IDC发布的《中国深度学习平台市场份额调研》显示,86.2%的受访企业都在使用开源的深度学习框架训练算法模型,其中飞桨成为中国企业使用度最高、市场份额最大的中国深度学习平台,唯一自主研发的集深度学习核心框架、工具组件、服务平台为一体的深度学习平台,也是市场份额唯一进入前三的中国平台。
    有如百度首席技术官王海峰的观点:“在智能时代,深度学习框架起到了承上启下的作用,下接芯片、大型计算机系统,上承各种业务模型、行业应用。”诸如飞桨等国产深度学习平台的规模化普及和高度易用,无疑为AI人才短缺给出了正解。
    回到百度之星的话题上,比00后“霸榜”更有价值的,是00后们在比赛过程中对人工智能的深入理解,对飞桨等智能时代操作系统的熟练使用,在比赛过程中出色的创造力,小小年纪就表现出的对技术的无限热爱。
    如此才是中国AI的希望。