国家战略下,百度飞桨扛起深度学习技术自强的大旗

曾响铃

    文 | 曾响铃
    来源 | 科技向令说
    科技自强从口号变成国家战略只在一夜之间。
    刚刚结束的十九届五中全会上,首次提出“把科技自立自强作为国家发展的战略支撑”。
    与十八届五中全会公报相比,十九届五中全会公报更加突出了创新在现代化建设全局中的核心地位,更进一步强调了科技的自立自强,并明确提出到2035年关键核心技术要实现重大突破。
    这表明,“十四五”期间,科技创新会被提升到一个更高的战略位置,以改变当前对美国技术依赖性强的被动局面,并成为拉动未来经济发展的重要力量。
    
    十九届五中全会与十八届五中全会公报比对(科技部分)
    在技术创新的众多选项中,深度学习框架作为AI时代的“操作系统”,是AI向更深层次发展必经的技术壁垒,也是科技巨头转型角逐AI时代的核心内容,因而,深度学习框架的自主自立在科技强国战略中意义非凡。
    警惕,技术依赖的困境不要在深度学习领域重演
    自2018年开始,美国商务部不断抛出“实体清单”,对中国企业实施技术封锁以来,有关中国科技产业“缺芯少魂”的讨论从来就没停止过。
    比如,由于缺乏高端芯片供应,华为最近发布的Mate 40成为余承东嘴中的“绝版”。
    再比如,PC时代的Windows、移动互联网时代的Andriod,这两个庞大消费市场的软件生态被国外底层操作系统厂商牢牢攥在手中,牵一发而动全身,科技霸权之下,中国企业进退维谷。
    然而,我们不应只看到当前的桎梏,还必须看到,关于未来的压力。
    AI到底有多重要,已不用再做赘述。“深度学习框架”作为连接AI技术与现实世界的枢纽,其作用至关重要。
    通俗地说,深度学习框架如同一个培养皿,它搭载在芯片、大型计算机系统上,承接各种业务模型、行业应用的“生产”,通过它,大量AI应用得以训练和成型,它就是“智能时代的操作系统”。
    “得框架者得AI”。
    谁占领了深度学习框架,谁就拥有了AI时代应用“生产”的“话语权”,谁就能构建一个因为约定的深度学习规则而排他的开发者生态,这个生态一旦到了一定规模,就会形成与Windows、Andriod类似的群聚效应,其他深度学习框架将很难有市场突破的机会。
    可是根据IDC去年发布的《中国深度学习平台市场份额调研》显示,在AI技术使用方面,接受调研的企业和开发者中,86.2%选择使用开源深度学习框架,其中Google、Facebook和百度占据了国内绝大部分市场份额,但位列前两位的Google和Facebook的深度学习平台的领先优势还是比较大。
    
    IDC《中国深度学习平台市场份额调研》各家排名
    虽然目前包括TensorFlow、PyTorch在内的深度学习框架都是开源的,但若“智能时代的操作系统”最终还是在他人手中成了气候、垄断了市场,在未来波云诡谲的国际产业竞争中,谁也不知道其所有者会使出什么方法来钳制我们的AI产业、继续卡我们的脖子!
    我们不能等到事到临头才想到要怎么去应对,现在就要行动起来了,自主可控的深度学习框架对于中国来说,不但重要,而且必要。
    火种,百度飞桨扛起深度学习技术自强的大旗
    面对TensorFlow、PyTorch等国外深度学习框架的围堵,好在百度飞桨站了出来。
    作为中国首个开源开放、功能完备的端到端深度学习平台,飞桨在核心框架(类似操作系统内核)、工具组件(类似于操作系统让你更方便使用的各种功能)和服务平台(类似于操作系统与你交互的界面)上,都进行了完整的体系化覆盖。
    
    飞桨深度学习平台全景图
    例如,在开发环节,飞桨已开源70多个经过真实业务场景验证的官方模型,涵盖视觉、NLP、推荐等AI核心技术领域,成为官方支持模型最多的深度学习平台。比如视频识别工具包,能为开发者解决视频理解、视频编辑、视频生成等一系列任务,可实现一键式的高效配置来做训练和预测;
    在训练环节,飞桨在提升协同训练效率的同时,还大幅度放松训练所需求的软件、硬件、带宽环境,通俗理解就是在各种学习条件下都能“好好学习”;
    在部署环节,飞桨在软硬一体的思路下,推出了针对多硬件支持的底层加速库和推理引擎Paddle Mobile以及Paddle Serving等,打个比方就是,除了教会学生知识,还给他们快速适应环境、实践上手的能力。
    以上可以看到,飞桨在想方设法降低深度学习的门槛,让“用户”快速上手,实现生产力;让产业无缝进入AI时代,完成变革。
    这对于中国的AI发展而言,无疑起到了至关重要的作用。飞桨的成功,将使我们在未来AI时代手中多了一个筹码,至少在AI的底层框架上能够做到自主自强。
    其实,飞桨并不是技术上的“纸上谈兵”,而是已经大量落地,赋能百业,正在我们身边发挥着价值。
    有学校用飞桨做出了一套林业虫情监测系统,可以远程监测病虫害情况,将原本需要两周的检查任务缩短至1小时,大大提升灾害防治的效率;气象局利用飞桨对遥感气象图像进行语义分割,识别积雪,获取气象信息;还有企业用飞桨构建机器学习框架,做出了一套手势翻译臂环,可以用在工业领域,还能在医疗甚至我们生活中使用……
    以上案例或许离普通人的生活较远,那么飞桨与华为的合作则让深度学习技术的价值发生在我们身旁。双方在硬件底层打通后,为端侧AI提供强劲算力,输入法应用因此可以得到25%的性能提升、节省22%的内存,降低50%的功耗,并且表现更加稳定,不会受到CPU的负载影响。
    
    百度飞桨与华为的合作在输入法上体现很明显
    在一定程度上来说,飞桨代表的不光是百度的技术成就和商业成绩,站在技术强国的战略语境下,飞桨还代表着中国深度学习的旗帜和高度。在飞桨所有的落地案例中,应用价值都通过数字可视化明明白白展示了出来,这既是飞桨的能力,也是飞桨能够成为“中国旗帜”的底气。
    崛起,科技强国战略下的时代利器
    响应科技强国战略,站在第四次产业革命的起点,飞桨责无旁贷的承担起中国在AI时代的产业基座,既是中国技术自强的代表,也是中国破局深度学习框架自主可控的一柄利器。
    虽然目前飞桨与TensorFlow和PyTorch这两个深度学习框架在通用能力上还有一些差距,但飞桨通过开放大规模深度学习模型训练技术,在训练规模和训练效率上(支持万亿级规模参数的模型训练)具有一定优势,特别是针对中国国情,推出无需代码编写的AI建模工具EasyDL,大大加快了AI产业化的普及速度。
    不久前结束的百度世界2020大会上,飞桨进行了再次进化,其能力又获得了大幅提升。
    作为百度大脑“软硬一体AI大生产平台”的“软”的层面,飞桨动态图功能升级,实现了动静态的结合,让用户更容易开发模型;全面升级的API体系,对于开发者更加友好。同时在硬件上适配22种芯片型号,覆盖15家硬件厂商,对国产硬件的支持超过TensorFlow和PyTorch。
    
    百度世界2020大会上百度CTO王海峰公开了飞桨最新升级
    在“硬”的层面,百度自研的AI芯片百度昆仑2在大会上预发布,相比2018年发布的中国首款云端通用AI处理器“百度昆仑1”,百度昆仑2的性能大幅提升,能够更好地满足各种场景的AI计算需求。百度飞桨,加上百度昆仑,软硬一体,使得中国在AI操作系统和AI芯片两大AI核心底层技术上拥有了自主知识产权。
    今天,我们有了强大的经济背景和领先世界的互联网环境,早已不是当年那样一穷二白,对未来力不从心。
    在错过了芯片和操作系统之后,深度学习框架应该获得更多的鼓励与支持,在飞桨带领中国深度学习框架走向更高巅峰之前,我们唯有送上祝福:
    为了国之AI的未来,百度加油!飞桨加油!
    *此内容为【科技向令说】原创,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。