揭秘阿里新大招:大模型只是前菜

科技新知


    技术的代际变革往往对商业格局产生深远影响。眼下,随着产业各界对大模型的投入布局加深,一个业界共识逐渐诞生:大模型正在改变云生态,将为云计算行业带来新的奇点。
    在过去的一段时间里,市场研究机构IDC在2022年底的预测报告中,将中国云计算行业在未来五年的平均增长速度下调了10%。这一调整是受到互联网行业整体增速放缓的影响,同时政企集成业务也在调整过程中。这些因素共同导致了互联网云厂商普遍降低了业务预期。
    在此背景下,AI大模型就是这次的技术奇点,阿里云是这轮变革的主要推动者。4月11日,阿里云峰会上,阿里巴巴集团董事会主席兼CEO张勇首次以阿里云智能CEO的身份亮相,旗下大模型产品“通义千问”随即面世。
    


    活动现场,张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,钉钉、天猫精灵已率先接入通义千问测试,并会在评估认证后正式发布新功能;阿里云智能集团CTO周靖人称,通义千问将基于阿里云基础设施向企业开放,企业可以在阿里云上训练企业自己的行业、垂类大模型。
    从已知信息可以推断出,阿里巴巴对于“通义千问”项目的战略部署,并未仅仅将目光停留在类GPT模型的领域,而是着眼于未来更为广阔和深远的应用场景,展示出雄心勃勃的远景规划。
    将把通义千问“装进”阿里所有产品
    在此次峰会上,张勇郑重宣布,未来阿里巴巴旗下的所有产品将与“通义千问”大模型进行整合,实现全面的革新与升级。
    “AI大模型的出现是一个划时代的里程碑,人类将进入到一个全新的智能化时代。就像工业革命一样,大模型将会被各行各业广泛应用,带来生产力的巨大提升,并深刻改变我们的生活方式。”张勇表示。
    拿钉钉、天猫精灵来说,钉钉在接入“通义千问”后增加了近10项新AI功能,通过类似微软Copilot(副驾驶)的设定,用户可以随地唤醒AI来辅助日常的工作。
    具体而言,根据钉钉当天预告的Demo演示,接入“通义千问”之后:
    在群聊场景中,钉钉在你被加入新的群聊时,能够依据群内过往的对话记录,智能生成一份聊天概要。这一功能旨在帮助用户迅速掌握讨论主题和上下文,免去繁琐的手动回顾过程,提高沟通效率。
    在钉钉文档场景中,“通义千问”展现出了全方位的办公辅助能力,无论是创作诗歌、小说、撰写电子邮件,还是制定营销策划方案等多种任务,均可得心应手。此外,除了生成各类文案内容,它还具备根据指令智能生成创意图片的能力,为工作带来更多便捷与灵感。
    


    在钉钉会议应用中,“通义千问”具备实时生成会议记录的能力,并能自动梳理出会议纪要和待办事项,提升会议效率。此外,钉钉视频会议还支持实时字幕功能,让参会者不仅能看到发言内容,还能清楚了解谁在发言。同时,新加入的会议成员可以通过智能摘要迅速掌握之前的讨论内容。在会议结束后,钉钉还可为参会者生成重点摘要和待办事项,帮助参会者高效安排后续工作。
    


    令人眼前一亮的是,钉钉展示了一种基于拍照生成小程序的场景。用户只需上传一张功能设计草图,就能实现低代码业务应用的快速生成,无需编写代码便可创建出一款实用的应用。如此创新使得应用开发的门槛得到了进一步降低,为广大用户带来更多便捷。
    钉钉之外,“通义千问”在天猫精灵上的表现同样不俗。
    


    依据天猫精灵官方展示的演示Demo,接入“通义千问”后,新一代的天猫精灵将具备更为灵活的对话能力。它能够根据用户的实际需求以及所处场景,实时生成相应的内容,为用户带来更为智能化和个性化的互动体验。
    例如,用户在跑步过程中,可以要求天猫精灵“根据180步频合成适合跑步的歌单”,同时还能与天猫精灵展开关于文化、人生等领域的深入交流。得益于“通义千问”强大的技术支持,天猫精灵的用户体验将更具智能化、便捷性和多样化特点,为用户带来更高品质的服务。
    淘宝天猫的电商业务,也有大量场景适合大模型切入。例如,以文搜图、智能客服、卖点文案生成等。这将使购物体验变化巨大,用户可以在需求模糊的情况下,通过更智能的交互直接找到合适的商品推荐。
    可以设想,在未来阿里巴巴所有产品成功接入“通义千问”大语言模型并实现全面升级后,各种各样的生活场景都有可能面临AI带来的应用方式的彻底改变和革新。这将为日常生活带来前所未有的便捷性和智能化体验。
    大模型生态“活水”
    以上,阿里巴巴的“通义千问”主要是与集团内部产品相结合,以提升产品性能和用户体验。然而,除了内部产品协同发展之外,阿里巴巴的大语言模型同样具有一条面向外部生态的路线。
    现阶段,老牌互联网巨头和人工智能新秀们纷纷押注大模型技术,期望从中获得更大的商业价值和科技突破。这种盛状使得大模型技术成为了科技领域的一股新风潮。
    目前,大模型技术已经取得了令人瞩目的成果,大型预训练模型在自然语言处理、文本生成、知识问答等方面表现出了惊人的能力。这些大模型在很多领域已经开始实现商业化应用,比如智能客服、内容推荐、智能写作等。
    


    然而,随着大模型技术的盛行,也引发了一些担忧。譬如,大模型需要大量的计算资源和数据,这使得研发门槛日益提高,可能导致只有少数科技巨头才能参与竞争。在某种程度上,这已经形成了国内人工智能发展的重要瓶颈。
    对此,此次云峰会,张勇表示,面向 AI 时代,所有产品都值得用大模型重做一次,为此,阿里云也希望帮助更多企业用上大模型,让每家企业都能基于“通义千问”,拥有具备自己行业能力的专属大模型。
    换句话说,在阿里巴巴提供的强大算力基础设施、先进的机器学习平台以及大模型服务的支持下,企业们不再需要浪费时间和精力去“reinventing the wheel”或是陷入针对大模型通用能力的无谓竞争。
    相反,他们可以将更多关注集中在开发具有原创性和专属特点的模型上,以推动行业的持续创新。
    周靖人进一步解释称,在未来的阿里云平台上,各个企业不仅能够充分利用通义千问的全面能力,还能根据自身所在行业的特点和具体应用场景,培训和定制自家的企业级大模型。举例来说,每家企业都有可能拥有自己专属的智能客服、智能导购、语音助手、文案撰写助手、AI设计师以及自动驾驶等相关模型。
    


    作为印证,发布会现场阿里云宣布将与OPPO安第斯智能云携手共建OPPO大模型基础设施,借助通义千问实现大模型的持续学习、精细调整以及前端提示工程。此外,诸如中兴通讯、吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登和掌阅科技等多家知名企业亦表示,他们将与阿里云在大模型相关领域展开技术合作的探讨与共同创新。
    为推广基于模型开发人工智能的新开发方式,除了开放大模型外,阿里云也在积极建设开源的AI社区生态。
    在2022年11月,阿里云率先提出了“Model as a Service”的创新理念,并随后推出了国内首个AI模型社区“魔搭”。在这个平台上,开发者们可以轻松下载各种开源AI模型,同时直接利用阿里云的强大计算能力和一站式的AI大模型训练及推理服务。
    


    仅仅几个月里,已经有超过百万用户共下载了1600万次各类模型。与此同时,平台上可用的模型数量也从最初的三百多个迅速扩展至八百多个。在这些模型中,参数数量超过十亿的大模型有三十多个,而超过百亿参数的大模型更是达到了10个。
    从这里来看,关于大模型生态的篇章才刚刚揭开序幕。
    阿里大模型的底气:AI基础设施内功
    从长远的角度来看,要实现“通义千问”在各行各业的广泛应用,离不开智能化技术的支持,以及在算力、算法和大数据等方面的技术优化。这些技术优势正是阿里巴巴多年来不懈努力和技术积淀的成果。
    


    拿大模型技术来说。公开资料显示,阿里云从2019年就开始同时研究多模态大模型和语言大模型。2021年,阿里巴巴达摩院相继推出了语言大模型Plug以及多模态大模型M6。随后在2022年9月,阿里大模型融合为“阿里通义大模型系列”。
    不仅如此,大模型的训练和运行背后同样需要强大的算力基础。这些算力要求包括以下几个方面:
    高性能计算硬件,大模型需要大量的计算资源,例如高性能的图形处理器(GPU)、专用的AI芯片;分布式计算,由于大模型的参数数量和计算复杂度非常高,单个计算设备很难满足其需求;高效的算法和优化技术,为了降低大模型的训练时间和计算成本,研究人员需要开发高效的算法和优化技术。
    总之,大模型背后需要强大的算力基础,包括高性能计算硬件、分布式计算框架、高效的算法和优化技术以及大量的训练数据和存储资源。这些因素共同支撑着大模型的成功运行。
    


    对此,阿里云做了充足准备。在峰会上,张勇表示,十多年来,阿里云已经累积了从飞天云操作系统、芯片到智算平台的“AI+云计算”的全栈技术实力,并在IaaS(基础设施即服务)和PaaS(平台即服务)的基础上,建立了第三层MaaS(模型即服务)的体系。
    具体而言,“飞天智算基础设施”智算IaaS服务涵盖了一系列卓越特性,包括能够支持高达十万卡GPU的单集群规模、可让多个万亿参数大模型同时在线训练的强大智算集群,以及为万卡规模AI集群提供无拥塞通讯的自主研发RDMA网络架构等;
    智算PaaS服务则以机器学习平台PAI为核心,可支持万卡的单任务分布式训练规模,AI训练效率提升可达10倍,推理效率提升可达6倍,覆盖全链路AI开发工具与大数据服务,深度支持了通义大模型的研发;
    智算MaaS服务包括通义大模型系列和以之为基础的企业定制大模型。
    以上这些表明,阿里云不仅致力于为自家大模型“通义千问”打造坚实的技术基础,而且还将把丰富的算力资源和大模型能力分享给更多企业和社会各界,共同推动AI技术的发展。
    可以看到,凭借长期积累的技术实力与研发投入,阿里巴巴在大语言模型相关技术的竞争中表现出色,在中国乃至全球范围内,均展现出了卓越的综合实力与竞争优势。
    也正是在此技术基础上,除了大模型这盘前菜之外,无论是阿里巴巴全面实施大模型改造其旗下所有产品的智能化进程,亦或是面向外部生态的大模型路线,这两盘“猛菜”共同构成了阿里巴巴别出心裁的战略布局。