开源一周年,奔跑中的MindSpore驶入快车道
曾响铃文 | 曾响铃
来源 | 科技向令说
2020年3月28日,华为开源了新一代全场景AI计算框架MindSpore。其具有基于源码的通用自动微分、自动实现分布式并行训练、数据处理、以及图执行引擎等功能特性,受到了多方关注。
时至今日,在MindSpore开源一周年即将到来之际,MindSpore社区将在线上进行全球直播,届时会邀请AI大咖进行分享,同时,也将预告MindSpore新特性、新工具等内容。
历经一年的发展,MindSpore发展到了哪一个阶段?海内外IT大厂纷纷布局的背景下,AI框架这一概念持续火爆,MindSpore能否走出不一样步伐?
经过一年的砥砺前行,奔跑中的MindSpore驶入快车道
曾经有业内人士形象的解释过,有人借助Windows操作系统办公;也有人借助安卓操作系统工作生活。AI亦如此,也需要一个这样的“操作系统”,而这个“操作系统”便是深度学习框架。
截止2021年3月,我国共有人工智能相关企业32.3万家,2020年全年新注册了16.9万家,同比增长323.6%。想要在如此巨大的AI市场拥有话语权,就需要在下接芯片、硬件系统,上连模型以及实际应用的AI框架领域掌握主动权。
常言道“得开发者得天下”,而开源则是聚集开发者最有效的方式。
截至2020年底,MindSpore社区已经发布了7个版本,拥有超过12000个PR提交、全球五大洲近10万用户安装试用MindSpore社区版本。
不仅如此,郑州数学工程与先进计算国家重点实验室与MindSpore合作,在多面体编译相关技术领域进行优化,解决了软硬件结合优化的重要问题,创新成果获得了顶级学术会议MICRO 2020的最佳论文提名。MICRO是计算机体系结构领域的国际顶级会议,这也是中国团队53年第3次入围该大会的最佳论文提名。
12月30日,在中国电子技术标准化研究院举办的“第十届中国云计算和标准应用大会”上,全场景AI计算框架?MindSpore还荣获“中国优秀开源项目”大奖。这一奖项是对MindSpore自动微分技术、自动并行设计等技术亮点的充分认可。
MindSpore之所以能在短期内取得这样的成绩,一方面源于其技术足够硬核。MindSpore拥有基于源码的自动微分技术、超大规模集群的自动并行设计、二阶优化、图算融合、量化训练等特性,适用于计算机视觉、自然语言处理等AI领域,可为数据科学家和算法工程师提供设计友好、运行高效的开发体验。
另一方面,则是MindSpore社区足够活跃。在MindSpore社区,研发团队会对开发者提出的问题给出及时的回答,尽量使得开发者可以友好地参与到社区的建设当中。因此在开源中国对码云1000多万个代码仓的统计后发现,MindSpore的社区开发活跃度均在97分以上,总得分高达99,位列第一。
这样来看,MindSpore能够在短期内达到如此高度也就不足为奇了,那么随着海内外IT大厂纷纷下场,属于MindSpore的机会还有多少?
深度学习框架迎来井喷潮,MindSpore打破存量博弈
有媒体统计称,谷歌的TensorFlow、Facebook的PyTorch、亚马逊的MxNet、微软的CNTK、Caffe、百度的Paddle-Paddle,阿里巴巴的X-DeepLearning,都已经相继开源。
2020年更是国产深度学习框架的井喷潮,除了MindSpore外,清华大学计图(Jittor)、旷视科技天元(MegEngine)、一流科技OneFlow皆同期开源。
究其深层次的原因,无非是因为开源框架是推进人工智能技术发展的重要动力,并且开源项目具有更新速度快、可二次开发、可扩展性强等特点,对于降低企业开发AI应用的投入具有很好的效果。
不过在竞争对手组成的重重包围圈中,从市场前景和自身能力来看,MindSpore仍有成为行业佼佼者的潜力。
首先,当前国内人工智能产业都处于起飞阶段。据悉2016年至2019年,中国人工智能产业的年均增长率为63%,2019年市场规模为555.8亿元,预计未来中国人工智能行业的市场规模将继续快速增长。这意味着整体AI市场在扩大,开发者不需要存量竞争,MindSpore也不需要和已经成熟的开源深度学习框架竞争。
其次,技术和运营是开源社区两大不变的核心,从技术的角度看,MindSpore已经拥有多项先进技术,并已经在诸多大型项目中得到落地应用。
MindSpore在设计时就具备了开发态友好、运行态高效、部署态灵活的特点,其能够帮助开发者快速上手。其所具有的多项能力也能充分适用于大规模集群环境等诸多的场景之中。
无论是在深圳湾实验室有关分子动力学的深度学习应用、鹏城实验室的智慧医疗项目中,还是Jina.ai神经网络搜索集成、广州海洋地质调查局海洋计算应用等场景里,都能够见到MindSpore的身影。并且MindSpore已应用于华为HMS生态中,每天调用量高达3亿次。
最后在运营上,MindSpore也是面向全球的人工智能开源社区。
MindSpore Study Group(简称“MSG”)仅启动4个月便在海内外多个城市顺利开展,深圳、杭州、苏州、上海、俄罗斯、新加坡、印尼等均已建立MSG组织。
除此之外,MindSpore还设立了技术治理委员会(TSC),集结了来自国内外14位技术专家。TSC每个月举办一次在线例会,社区运营者在会上向委员反馈社区的进展,保证所有版本与计划的公开透明。
当然,不仅仅局限于当前的优势,未来政府政策的支持和行业人才的引进,也正在成为加速MindSpore发展的有利因素。
拒绝“半途效应”,站在巨人肩膀上的MindSpore能否成为“巨人”?
2021年,人工智能行业迎来政策红利大年。
先是人工智能被明确定为新基建七大领域之一,而在2020年底召开的五中全会中,十四五规划建议36次提及“科技”,人工智能成最优先发展的领域之一,提出“把科技自立自强作为国家发展的战略支撑”, 重点是解决国家卡脖子工程,包括有人工智能、芯片等领域。
不过好事多磨,大量事实证明目标行为过程的中点附近是一个极为敏感和脆弱的区域,这也就是常说的“半途效应”。
但在“科技向令说”看来,“半途效应”有助于加速行业整合,对MindSpore这批行业头部实力强劲的玩家是有利的。
另外,MindSpore的提前布局也有助于其抓住机遇,抗住“半途效应”的辐射范围。
其一,人才培养一直是昇腾计算产业的重点之一。
华为此前已经和专家学者合作,联合出版了3本昇腾相关的教材,陆续在国内100余所高校开设昇腾相关课程试点,并基于“智能基座”产教融合协同育人基地,让昇腾成为高校理工科相关专业学生的必备技能。
其二,华为自身强大的生态保障,也让资本市场对于MindSpore未来的发展充满信心。
目前,全球用户超过4亿的华为手机大量地用到MindSpore,基本上华为手机上面只要AI相关的应用,其实它的底层大多都是MindSpore Lite在支撑。
有人用才有生态,在MindSpore开源之后,大众所见即所得,开发者所提出的一切有价值的内容,最后都会闭环到Gitee或者Github的bug fix或者feature proposal上。开发者能够挖掘更多的技术潜力,既能成为“巨人”,又可以站在“巨人”的肩膀上。
其三,MindSpore也并未固步自封,一直在不断更新。
据“科技向令说”统计,MindSpore在开源初期达到了每个月出一个版本的疯狂速度,而在1.0版本发布后,也能保证每个季度发布一个新版本。对于MindSpore这种体量,不仅体现了华为做完全开源深度学习框架的决心,而且保障了项目的质量,为开发者提供了一个良好的开源平台,这或许也是其社区活跃程度较高的原因之一。
随着时间已经步入2021年3月,MindSpore开源一周年也即将到来。为了庆祝MindSpore开源一周年,3月28日至29日,社区将在线上进行全球直播,不仅有MindSpore新特性预告,更有开源大咖、领军企业领袖、资深布道师助阵,欢迎大家一睹为快、积极分享,为开源AI生态贡献智慧。
*本文图片均来源于网络
*此内容为【科技向令说】原创,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。