Meta押注人工智能新武器

新材料情报NMT

    前言:
    人工智能正在席卷互联网。每天都有越来越多的公司将AI 集成到他们的产品和服务中。
    Meta为了发展AI,在定制芯片和超算上下了大赌注。在最近的一次线上活动中,Meta拉开了开发自己的基础设施的序幕。
    
    Meta研发人工智能
    今年2月的报告显示,Meta的营收首次出现下降同比下降1%,公司去年的运营利润下降38%。
    但值得注意的是,在上个季度,公司在人工智能方面实现了比前一年多出20%的广告商转化率,研发出人工智能产品可以显著提高对目标广告客户的吸引力。
    Meta首席执行官扎克伯格于2023年2月底宣布,公司将创建一个新的“顶级产品团队专注于研发生成式人工智能”,这一举措帮助了Meta在新兴的人工智能领域加速发展。
    目前公司从子公司中组建一个人工智能研发团队,开发人工智能“角色”,为其社交媒体平台的用户提供图像、视频和多重体验。
    
    科技巨头都在加码投资
    扎克伯格最近表示,Meta看到了:以有用和有意义的方式向数十亿人介绍人工智能代理的机会。
    显然,随着Meta加大对AI的投入,MTIA芯片和超算计划将是Meta与其他科技巨头竞争的关键工具,现在没有哪家巨头不在AI上投入大量资源。
    谷歌、微软和亚马逊等其他科技巨头也在这一领域投入巨资。比方说谷歌的TPU,用来训练Palm-2和Imagen。亚马逊也有自己的芯片,用于训练AI模型。
    此外,有消息称微软也在和AMD开发一款叫Athena的芯片。
    
    Meta的自研芯片MTIA
    Meta从数据中心设计到训练框架再到数据集和算法,对AI全链条资源进行的整合。
    MTIA有望使Meta能够开发更复杂的AI模型,这些模型可以执行自然语言处理、计算机视觉和机器学习等任务。
    这可能会导致一系列新的AI 产品和服务,例如:更准确和个性化的推荐、改进的欺诈检测和预防、增强的客户服务、新的AR和VR体验。
    Meta基础设施副总裁 Alexis Bjorlin在TechCrunch 的采访中将自研芯片形容为“构建对堆栈所有层面的控制能力”,是很重要的。
    目前Meta公布自研芯片进展,Meta Training and Inference Accelerator即Meta训练和推理加速芯片简称MTIA,将专注于人工智能推理,而不是训练。
    定制化的MTIA采用开源芯片架构RISC-V,在类型上属于ASIC专用集成电路,是提高效率和水平的重要芯片。
    它的功耗仅有25瓦,远低于英伟达等主流芯片厂商的产品功耗。
    它可以并行执行多个任务,适用于AI加速计算,将成为Meta人工智能训练和推理芯片家族中重要的组成部分。
    第一代芯片MTIA v1于2020年开始设计,其采用台积电7nm制程工艺,运行频率800MHz,TDP仅为25W,INT8整数运算能力为102.4 TOPS,FP16浮点运算能力为51.2 TFLOPS。而最新一代预计将于2025年发布。
    
    Meta可扩展视频处理器MSVP电脑芯片
    随着生成式AI等新技术内容产生,人们对视频基础设施的需求进一步加剧,这推动Meta推出了一款可扩展视频处理器MSVP。
    除了MTIA,可扩展视频处理器MSVP也是重点。
    MSVP是Meta内部开发的第一个专用集成电路(ASIC)解决方案,专为应对视频点播和流播的处理需求而设计。
    Meta多年前就开始构思定制的服务器端视频芯片,并在2019年宣布了一款用于视频转码和推理工作的ASIC。
    Meta表示,公司的计划是最终将大部分成熟的视频处理工作负载转移给MSVP,只对特定定制和提高质量的工作负载使用软件进行视频编码。
    MSVP是通过智能去噪和图像增强,伪影去除和超分辨率等后期处理方法,来提高视频质量方面。从而实现生成式人工智能、AR/VR和其他虚拟现实内容的高效交付。
    
    Meta的AI超级计算机RSC
    除此之外,Meta 还宣布,该公司的超级计算机 Research SuperCluster(简称“RSC”)已经进入到第二阶段,也就是最后一个阶段。
    这台超级计算机包含 1.6 万个英伟达 A100 GPU,Meta 使用这台超级计算机训练其 LLaMA 大语言模型及其他技术。
    据Meta公告,其AI超级计算机(RSC)是世界上最快的人工智能超级计算机之一,在训练下一代大型AI模型,为新的AR工具、内容理解系统、实时翻译技术等提供动力。
    LLaMA是Meta在今年早些时候构建并开源的大型语言模型,具有650亿参数规模。
    Meta称其目标是提供一个更小、更高性能的模型,研究人员可以在不需要重要硬件的情况下对特定任务进行研究和微调。
    
    结尾:
    Meta自定义设计其大部分基础设施,因为这能使其优化端到端的体验,包括从物理层到软件层再到实际的用户体验,其可以根据自己的特定需求对其进行定制。
    这些基础设施将支持Meta开发和部署更大规模、更复杂的AI大模型。
    将成为一个爆炸性增长的关键领域。