拿下AI大时代的“操作系统”，飞桨如何为中国赢得全球深度学习话语权？

2024.04.04 曾响铃

    任何一个新兴科技领域在经过草莽式的发展后，必然无法逃离“社会化大分工”的普遍行业逻辑，出现承担起基本能力输出与服务的巨头平台，而合作伙伴、客户／用户开始专注于事业本身的创新与创意。
    深度学习就是这样一个时代的产物。
    在2019年中关村论坛上，百度所主办的平行论坛“AI时代的深度学习技术与应用创新论坛”中，百度PaddlePaddle（中文名“飞桨”）深度学习平台被重点关注。
    正如该论坛上深度学习知名学者、马里兰大学帕克分校教授Dinesh Manocha在例举大量机器人和自动驾驶技术AI研发与应用后对飞桨的评价所说，“飞桨是一个非常好的通用架构，并且它是非常灵活的……它是一个非常好的开放平台……希望在未来能够将更多的模型应用在不同的行业里”，毫无疑问，飞桨已经越来越发挥出AI浪潮的幕后推动价值——看得见的是百度AI技术产业落地，看不见的是“飞桨”。
    这些也意味着深度学习平台将很大程度掌控AI时代的话语权，这个被称为AI时代“操作系统”的东西，在全球范围内的话语权战争也已经打响，Facebook PyTorch最近在时隔仅2个月就急不可耐地发布PyTorch 1．3，“硬刚”Google在10月1日发布的Tensorflow 2．0，硝烟弥漫……
    只不过这一次，中国彻底准备好了。
    “操作系统”混战巨头各有“调性”，中国锁定“产业智能”
    总体而言，全球范围内叫得上号的深度学习框架主要有四大玩家，三个位于美国（微软Cognitive Services、Facebook Pytorch、Google TensorFlow），中国仅有一根“独苗”（百度PaddlePaddle），它们是AI时代的“操作系统”混战的主要力量。
    而虽然都是深度学习，巨头们的产品也各有不同之处，这也决定了短期的竞争格局。
    先从中国看起，当谈论起深度学习框架时，尽管“飞桨”也具备多方面的适应性，例如其用户既有Intel、Nvida、华为、中国联通、中信银行等产业组织，也有北京航空航天大学、中国科学院大学等学院派，但总体而言，飞桨的“人设”在所有玩家中与产业集合最为紧密。
    在2019年中关村论坛深度学习平行论坛上，百度王海峰就直接表示，“希望更好的把深度学习技术标准化、自动化和模块化，应用于各行各业的工业大生产，去赋能各行各业，帮助产业的智能化转型。”
    这也体现在了飞桨面向产业应用的代表性技术优势上，目前飞桨其开放了覆盖多领域的工业级模型库，支持100多个经过产业实践长期打磨的主流模型，其中包括在国际竞赛中夺得冠军的模型，同时开源开放200多个预训练模型，官方称目标是“助力快速的产业应用”，这个表述中，与产业升级联动的调性已经很明显。
    从实际案例来看，例如在传统工业质检领域，致力于机器视觉在工业质检方面应用的大恒图像就与飞桨合作，解决了传统基于机器学习特征工程方法对外观缺陷类质检无法快速进行场景切换、场景与场景之间的迁移研究成本高、识别效果差等痛点问题，在飞桨深度学习的框架下生成模型，实现产品缺陷分类，实际应用到流水线检出率已达99．8％。
    类似的案例还有很多，但总而言之，飞桨走的产业智能化升级联动路线在全球范围内十分独特，反过来看，这恰恰也是中国现阶段独一无二的产业发展现实所决定，飞桨顺应了这个趋势。
    而在国际上，准确地说是在美国，深度学习框架的竞逐颇有“百花齐放”的意味。
    例如微软的Cognitive Services注重垂直能力经营，其深度学习平台服务涵盖图像、视频、文本和语音等各个领域，2018年重点推出的完全自动化的平台Microsoft Custom Vision Services就是视觉领域的强化，这符合微软一贯从垂直领域做产品而不做大平台的调性。
    而Facebook的Pytorch则更像是一个学究型开放平台，实验室气质十分浓厚，Pytorch一开始就致力于为研究者服务，例如在2019年，引用PyTorch的论文数量就爆速增长了194％，在学院派AI阵营中颇有地位。
    不过，Facebook也在试图改变这一境况，现在包括Uber等大公司也开始采用PyTorch。
    与之对应的是，是有评论认为，“PyTorch搞定研究，TensorFlow搞定业界”——作为Google家的产品，TensorFlow比冤家对头PyTorch更有现实应用色彩，用来为实验室刷AI论文的痕迹不那么浓。
    而TensorFlow打出旗号——任何人都可以用，学生、研究员、爱好者、极客、工程师、开发者、发明家、创业者——其在安卓之外再度垄断一个操作系统的野心也十分明显了。
    产业应用“必要＋充分”，中国深度学习具备唯一的生态“完全体”基因
    深度学习在中国的境况，与互联网在中国的境况类似：庞大的应用市场和需求，哺育出最广泛、全面的前沿技术与产品，这些技术和产品在持续“供养”下又能极大满足市场需求，并实现国际领先。
    互联网、AI等的弯道超车就是这个逻辑，这种“必要＋充分”的双向循环，即是典型的生态“完全体”，是中国所有前沿技术应有的独特优势，飞桨也处在这样的环境中，只不过是放到产业视角下看。
    1、越是产业规模庞大的国家，越需要集中的深度学习能力共享
    深度学习平台本质是AI能力的一种云上“共享经济”，平台把自己的知识储备拿出来，通过框架设计共享给更多开发者，“操作系统”的意义即在于此。
    只有需求这种能力共享的AI项目越多，深度学习平台的“共享”价值才更能凸显。
    作为全球GDP排名第二，制造业第一，服务业蓬勃发展的东方大国，中国产业的智能化需求催生出全球最为庞大的深度学习需求，飞桨的出现和壮大是必然。
    而反过来，飞桨本身也必须适应这种庞大、多样化的共享需求，其中既有能力上的广泛适应需求（不能偏科），也有系统上的集中承载需求（要能扛得住）。
    飞桨的一个领先的技术优势之一，就是支持超大规模深度学习模型的训练。根据官宣，目前飞桨突破了超大规模深度学习模型训练技术，是世界首个支持千亿特征、万亿参数、数百节点，攻克了超大规模深度学习模型在线学习难题，且实现了万亿规模参数模型实时更新的开源大规模训练平台。
    能力与需求“握手”，中国大本营是飞桨国际化竞逐的底气。
    2、产业的“跃迁式”发展，让中国更需要深度学习平台
    除了应用的广泛，如何让应用更便捷实现，是所有深度学习平台竞逐的重点，无论是PyTorch 1．3还是Tensorflow 2．0的版本更新，都打出了易用、好实现这张牌。
    而这件事放到眼下的中国，情形更为特殊。
    中国金融科技的发展，是在原本传统的金融业基础上跨越而来，反而领先了国外。而中国的产业演化也在经历同样的过程，从十分传统到十分智能的大跨度式跳跃，快速开发与部署的需求更为强烈。
    但是，AI这件事必须投入大量人力物力去钻研，不论是传统领域，还是做服务的创业企业都很难支撑。
    当飞桨打出“开发便捷的产业级深度学习框架”旗号时，也就是在契合这样的需求，其采用基于编程逻辑的组网范式，对于普通开发者而言更容易上手，符合他们的开发习惯，同时，平台支持声明式和命令式编程，简言之就是兼具开发的灵活性和高性能。在这种情况下，飞桨亦实现了网络结构自动设计，模型效果超越人类专家。
    这些属性无疑能帮助那些需要跃迁式发展的企业在AI领域快速使用深度学习的成型算法，解放出更多精力放在重要业务上。
    3、已有丰富的案例落地，产生AI领域的低成本知识裂变价值
    先来看一个案例。
    “红脂大小蠹”长期侵害中国植被森林区，对生态影响很大，过去的解决办法是人力翻山越岭巡查，找到害虫聚集区采取措施。除了专业人才需求大，也容易出现巡查漏洞，贻误治虫时机。
    嘉楠捷思、百度飞桨和北京林业大学共同合作研发出了智能害虫检测系统解决了这个林业的痛点问题，利用搭载AI芯片的摄像头模组进行虫子的检测与识别，分析病虫害当中虫子的种类，以及害虫集中在哪个层面，以进行针对性的防治。
    在这一过程中，飞桨提供框架，嘉楠捷思利用飞桨快速开发识别模型并通过芯片摄像头模组落地，北京林业大学则提供害虫、森林知识图谱，三方共同完成的“智能害虫检测项目”已经开始走向商业化。
    通过一个三方合作，飞桨的图像识别技术即顺利实现了产业应用，在林业领域实现了一个知识裂变的案例。
    类似的案例还要更多，王海峰在2019年中关村论坛深度学习平行论坛上把飞桨定义为“一个源于产业实践的深度学习平台”，显然，深度学习平台的开放与实践，产生了更大的AI产业智能化实践价值，同一知识在不断裂变出大量案例并走向现实和商业应用。
    AI与产业升级，两场不能失败的战争、一个“幕后英雄”
    Windows操作系统控制PC时代的交互窗口，现在控制着“生产力工具”，安卓、iOS控制着移动互联网时代的交互窗口，主宰了“消费力”窗口。
    如果说过去没有掌握操作系统的话语权还尚能接受，只是在被扼住咽喉时难受一下，而AI大时代的“操作系统”一旦丧失主动权，其影响将是广泛的。毕竟，全民AI、全面AI的时代即将到来，深度学习的话语权间接影响了一个国家的方方面面，从消费到产业，从个人到组织，都无法逃脱影响。
    这种“操作系统”的遏制力体现在，一旦大多数开发者都习惯于某一套框架下的AI应用开发方式，将带来很大的迁移成本，而平台方出于某些目的一旦限制开放、限制专利应用，将直接锁死下游开发者。
    类似的在操作系统上的教训，我们已经深深见识过了，未来AI时代不能再如此了。
    这也说明，全球视野下的深度学习平台的PK，不只在技术优劣更在生态构建，尽快扩大生态、提升行业影响力是与技术同等重要的事。
    好在，飞桨的一些动作客观上在实现这种影响力的构建。
    飞桨代表性的领先技术优势之一是多端多平台部署的高性能推理引擎，也即不仅兼容其他开源框架训练的模型，还可以轻松地部署到不同架构的平台设备上。同时，经过跟华为麒麟NPU的软硬一体优化，飞桨在NPU上的推理速度进一步突破。
    这些都是兼容并蓄的表现，飞桨是一个灵活的、可以接纳所有不同开发者、开发条件的“操作系统”，具有理论上无限的延展性。也只有这样，才能保证影响力的持续扩大、生态的全方位渗透和充实，而不是“封闭王国”。
    同时，在全球产业升级浪潮下，各国都在拼转型拼升级，开放的深度学习平台作为推动产业智能化的重要内容，无疑是大国战略一个更为底层的构成要素，更类似于“幕后英雄”——它不直接表现出竞争优势，却在背后影响着国家的整体竞争力，既有直接的产业推动，也有国际AI话语权的掌控。
    这一次，中国能不能不再被扼住咽喉，甚至反客为主，拭目以待吧。