大模型走向产业的一小步,AI走向普惠的一大步

脑极体

    蒸汽机,在工业革命中扮演着怎样的角色?
    保尔·芒图在《十八世纪产业革命》中是这样形容蒸汽机的:“蒸汽机并不创造大工业。但是它却为大工业提供了动力,更重要的是使大工业具有统一性。使用蒸汽机,使一切工业的发展都要服从一般的法则,工业世界成为一个巨大的工厂。”
    可以说,蒸汽机是工业革命的心脏,是手工生产走向模块化、标准化的通道。此后每一次产业革新中,世界的优先任务都是寻找那部“蒸汽机”。当深度学习推动AI技术又一次复兴,人类对它的最高期待,就是让AI成为第四次产业革命中的“蒸汽机”。而近几年身处智能革命前沿的,就是预训练大模型。
    然而必须正视的是,全球大模型竞赛中,我们看到大模型的参数越来越大,数据集记录不断被刷新。但真正的产业空间里,却很难看到大模型规模化、标准化应用。这可能是因为大模型与行业知识不相匹配,行业算力基础难以负载大模型部署等等问题。我们似乎一直都在造一台不能走进工厂的“蒸汽机原型机”。
    在中学课本里,我们都知道是瓦特改良了蒸汽机,却没有提是谁发明了蒸汽机。其原因在于,瓦特真正解决了蒸汽机走向应用的问题,从技术、产品、商业模式等问题上让蒸汽机具有与行业结合的可行性。
    就在刚刚,似乎大模型也跨出了这历史性的一步。
    百度与国家电网、浦发银行等行业头部企业联合研发,融合了通用数据和行业特有知识,推出知识增强能源行业NLP大模型国网-百度·文心,和知识增强的金融行业NLP大模型浦发-百度·文心,显著提升了大模型在行业任务上的应用效果。
    “行业大模型”,这个我们从没听说过的概念背后,是大模型走向应用化的开端,是百度多年探索深度学习技术走向产业的又一次瓜熟蒂落。
    
    5月20日,由深度学习技术及应用国家工程研究中心主办、百度飞桨承办的WAVE SUMMIT 2022深度学习开发者峰会在线上举行。期间,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰博士发表主题演讲,提出“产业级深度学习开源开放平台飞桨助力人工智能越来越普惠,赋能千行百业,惠及千家万户”。
    
    2019年的WAVE SUMMIT,王海峰提出深度学习技术已经具备通往工业大生产的条件,并且明确了标准化、模块化、自动化的三大特征。彼时开始,百度与AI开发者、各行业AI应用者共同开始了一场在21世纪筑造蒸汽机的旅程。如今,王海峰指出在AI工业大生产阶段,深度学习技术的通用性越来越强,深度学习平台的标准化、自动化和模块化特征越来越显著,深度学习应用越来越广泛且深入,已经遍地开花。
    技术、平台、应用三层标准,是一项技术走向产业普适的核心。回到蒸汽机的故事,瓦特也是改写了蒸汽机的这三大要素。在技术上实现了气缸恒热,确保了机械效率;在平台上实现了器件的标准化,工厂能买到可维护、可换新的产品;在应用上则与大量工厂主合作,让蒸汽机走进经济生产。就这样,原本昂贵、效率差、损坏率高的蒸汽机,变成了高效、低门槛的工业化代名词。
    今天,百度和中国AI产业也在进行这样的探索。大模型让深度学习的技术效能不断增强,飞桨实现了AI工业大生产所需的平台化支撑,百度与各行业开发者的合作,让AI应用之花开遍了中国原野。
    在WAVE SUMMIT 2022,我们可以清晰看到深度学习技术,预训练大模型,是如何一步步变成那台“蒸汽机”的。
    大模型做实,从无尽跑分转向全面可用
    预训练大模型是近几年AI产业最火热的技术名词。拼模型参数,拼任务集完成效果,是厂商推出大模型后最喜欢做的几件事。换个角度看,大模型依旧处在“无尽跑分”的初级阶段。
    从高分到高能,大模型距离现实中的产业场景还有不短的路程要走。比如很多产业需求无法用通用模型来处理,技术与使用场景之间存在代沟。再比如超大规模模型在部署时会面临一系列问题,比如算力、调参难度、硬件兼容性等。
    让大模型从“跑分考场”走向千行百业,需要一场全面的转向。而这就是今年WAVE SUMMIT最亮眼的一个发布和升级。
    
    百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜表示,今年是大模型产业落地的关键年,飞桨文心大模型通过搭建更适配场景需求的大模型体系,提供全流程支持应用落地的工具、平台和方法,建设激发创新的开放生态,解决大模型技术与场景需求匹配的关键问题。
    
    面向行业智能化需求,百度围绕大模型产业级与知识增强两大关键词,公布了全新的飞桨文心大模型全景图。在模型方面,形成基础大模型、任务大模型、行业大模型的三级体系,以更有效地支持应用需求,并发布10个全新的大模型;为促进大模型惠及最广泛的行业与开发者,还配套发布大模型套件、API、平台,并建设大模型创意和探索社区旸谷,来帮助开发者更低门槛地应用。
    文心大模型家族新增的十个大模型,基础大模型包括融合任务相关知识的千亿大模型ERNIE 3.0 Zeus、多任务视觉表征学习VIMER-UFO 2.0、商品图文搜索表征学习VIMER-UMS、文档图像表征学习VIMER-StrucTexT 2.0、语音-语言跨模态大模型ERNIE-SAT和地理-语言跨模态大模型ERNIE-GeoL,任务大模型包括面向生物计算领域的化合物表征HELIX-GEM、蛋白质结构分析HELIX-Fold。
    尤其值得注意的,还有文心大模型在业界首次打造发布的两个行业大模型,实现了通用模型为主干,任务模型面向具体需求,行业模型面向具体产业的“三元化结构”,从而使得不同需求、不同行业的开发者可以第一时间找寻到大模型的落地方案,不再“望大模型而兴叹”。
    最新发布的行业大模型,包括国网-百度·文心电力行业大模型和浦发-百度·文心金融行业大模型。背后是百度与国家电网、浦发银行等行业头部企业进行了联合研发与创新,更好地融合了通用数据和行业特有知识,从而有效提升了大模型在电力、金融领域的行业任务应用效果。
    行业大模型可以说是一个业界期待了很久的转折点。从拼数值到效果落地,大模型需要一个转向应用化,强联接产业的范式与方法,而行业大模型则正填补了这一空白。
    除此之外,百度还发布了围绕大模型的全新开发套件,让开发者可用高效率应用大模型开发,同时提供相应的平台功能与API服务,进一步降低大模型使用门槛;在生态建设方面,文心大模型将共享飞桨生态,通过基于文心大模型推出的创意社区——文心·旸谷大模型创意与探索社区,让更多用户感受到文心大模型的应用潜力。
    2022年,欧美科技公司依旧执着在大模型参数上不断强化,再强化;而百度AI则将大模型转向了行业场景与真实需求。这个分叉路口的交错,会给未来提供太多可能性。
    飞桨做深,支撑大模走向产业
    无论是传统的深度学习模型还是大模型,都离不开开发平台的有效支撑。百度能够推动大模型快速走向产业化落地,从产业需求中真实吸收和提炼大模型的升级方向,本质上离不开深度学习平台飞桨,已经建立了与开发者、产业界、学界的高效沟通通道。
    在飞桨的生态基础上,百度可以最快速看到中国AI场景与开发者的需求,以高速的频率做出回馈,最终组成产业需求与平台供给之间的急速互动。放眼全球AI产业,这可能是技术、平台、产业之间互动的最佳范式。
    每次WAVE SUMMIT,我们都能看到飞桨进行巨量的技术升级,让人感觉似乎已经不可能有新的升级空间,然后又一次次完成突破。这背后就是最懂中国需求,与产业智能同在的飞桨范式。
    在技术、场景、生态的三大领域,飞桨完成了进一步深化。深挖技术方面,飞桨框架v2.3正式发布。沿着动静统一的框架设计理念,继续将开发效率与灵活性结合到一起,让开发平台突破性达到了更加成熟的状态。同时也将模型压缩技术进行了升级,提升了深度学习模型的自动化部署能力。
    
    在平台层面,飞桨推出了最懂中国AI场景的训推一体导航图,打通了全流程的智能导航,更新了产业模型库和产业实践,让开发者可以更低门槛获得开发经验与开发能力。与此同时,支撑科学计算的PaddleScience赛桨,以及便携式AI工作站,也解决了现实场景中最迫切的AI开发需求。
    在生态领域,飞桨提出了共建硬件生态圈的新行动。AI落地行业场景,是不可能离开硬件适配与算力底座的。这可能是很多算法为核心的AI企业很少提到的话题,却是产业智能化不能规避的一面。在飞桨一步步走向AI工业大生产平台的过程里,也在一步步探索与硬件厂商合作、互补,组成生态。在2020年,飞桨还是更多去寻找硬件合作伙伴,达成兼容性合作,也就是共聚阶段。那一年,百度与13家伙伴联合发起了飞桨硬件生态圈,促进AI产业链的适配升级;2021年,硬件伙伴开始与飞桨共同创新,共同研发更好的AI落地方式,共同创新开始成为飞桨硬件生态的推动力;时间来到今天,飞桨的硬件生态已经初具规模,合作进一步深化,实现了全面共创。如今,百度已经和硬件伙伴一起推出厂商版飞桨框架、建设模型库、开发课程,共同加速产业智能化升级。
    
    至此,飞桨已经可以从架构、硬件、行业场景、开发特殊需求等等维度,实现由最深处支撑大模型落地,AI工业化开发。截至目前,飞桨平台已凝聚477万开发者,服务18万家企事业单位,累计创建了56万个模型。
    飞桨,正在像蒸汽机、电力、燃油一样,成为可以低门槛、高效率应用的千行百业生产底座。
    百度AI,正在分子化融入中国大地
    文心大模型成为首个全面转向应用的大模型序列;飞桨成为了最了解中国经济需求,最深入中国AI场景的开发平台。这不是一场魔法,不是什么突然实现的黑科技,而是一段一脉相承,步步为营的故事。
    几年前,有太多企业面对着AI许下了宏大的心愿,但今天他们再也不提起AI了。画几页PPT,宣布一个庞大愿景很容易。但在大浪褪去后,坚定实践每一个诺言却很难。在WAVE SUMMIT上,我们能看到百度依旧扛着深度学习的旗帜,向技术的无人区,向产业的战略高地,向中国大地最深层智能化需求冲过去。
    面向让AI开发标准化、自动化、模块化的目标,百度AI将自己一步步解耦,再以最小的分子化形态融入中国无比广泛的开发需求。在远离喧嚣的乡村角落,在最严苛的工业核心,在最前沿的科学研究,百度的AI技术都能渗透进去。他们把深度学习的铁杵磨成了针,深入那些真正需要智能的产业缝隙里。
    你可能不会想到,AI能够在牧区的农贸市场完成“相牛”师傅的工作,推动畜牧业走向市场标准化,现代化。这背后是飞桨的低门槛特性作为支撑。
    你可能不会想到,在数据不能出车间的工厂里,飞桨可以通过便携式AI工作站抵达生产核心,带来工业智能化的无穷想象。而这只是飞桨产业级特性的一个缩影。
    你可能不会想到,飞桨已经在与中国所有主流的超算中心进行适配,为了帮助前沿科学研究项目走向智能化。这只是飞桨在跨领域、跨学科探索的一个侧面。
    从2019年正式提出工业化大生产目标,百度AI依托飞桨连绵不绝的升级,开始伴随各行业一起步入深度学习赋能产业的深水区。2020年,突如其来的疫情带来了一系列变化,各行业开始加速拥抱数字化、智能化,这也让飞桨更加高效地肩负起支撑产业的责任。2021年,瞄准AI技术降低门槛,融合创新的新特点,百度持续打造了低门槛的飞桨使用体验,推出了知识增强大模型的关键创新。
    伴随着百度AI的步步深入,一次次降低门槛,提升技术支撑力,各行业也开启了更加积极的AI探索。从少量先行者探索AI,到大量企业开始“工坊”式尝试AI,再到企业开始以大规模资源协同的方式,启动AI工业化大生产。千行百业的智能化、数字化需求逐年深入,随之而来的智能需求也不断加强。为此,百度打造了以云计算为基础,以AI为引擎的赋能形态,支撑企业数字化、智能化升级一步到位。
    在技术供给与产业需求同步提升的同时,百度此前提出培养500万AI人才的目标也在持续进展。各种各样的产学研联合培养方式与AI技术社区,保障了智能化过程中的人才基础。
    王海峰认为,在深度学习技术及平台的支撑下,人工智能呈现出融合创新、降低门槛的特点,将继续推动科技革命和产业变革,加快产业智能化升级。
    这些特点并不是凭空浮现,而是一步步探索出来,一点点锤炼出来。在技术研发、平台打造、生态培育、应用落地的一重重探索下,真正的普惠AI正在实现。
    时间来到2022年,面对大模型走向实用化,各行业开始以AI重构和升级生产力核心。我们会有点惊奇地发现,那个把AI技术变成21世纪的蒸汽机,让第四次工业革命发生在中国的诺言,似乎开始一步步,一点点地实现了?
    那些听起来稚嫩的希望,
    那些看上去荒唐的梦想,
    那些迟迟不敢说出口的诺言,
    就去试试吧。
    就去一次次调参那些模型,去在深夜里回复每个开发者的疑问,就去深入车间,深入牧场,深入实验室。去直面需求,升级技术,锤炼平台,共创生态,去实现那个关于大模型,关于深度学习技术的,最深的,最大的,也是最美好的梦。
    中国AI不是一张空头支票。而是真的有人在把大模型、把AI技术变成一个机会,一个撬动产业变革,撬动智能革命的机会。
    
    还记得年少时的梦吗?
    像朵永远不凋零的花
    让第四次工业革命发生在中国,又为什么不能实现呢?