2023WAIC大会后记：我们距离AGI还有多远？

2024.09.27 产业家

    只有解决了算力问题，才能离大模型的商业化之路更进一步，等等问题，都在成为当下限制我们想象力的关键因素。继2023世界人工智能大会后，大模型还有多少想象力？
    作者|思杭
    编辑|皮爷
    出品|产业家
    1亿用户，似乎是每个App都想踏过的“门槛”。TikTok用时九个月，ChatGPT用时两个月，而被称之为“Twitter Killer”（推特杀手）的Threads仅用不到五天的时间，就达到用户量破1亿的水平。

    Threads的定位是基于Instagram上的对话App。也就是说，Instagram的用户可以用账号注册Threads，并且他们在Ins关注的人也都会转移到Threads上。这也是为什么，拥有了聊天功能的Threads，也号称复刻版推特，或推特杀手。自此，人工智能领域将展开马斯克与扎克伯格的新一轮“角斗”。
    这些都在成为7月6～8日的本届世界人工智能大会的最新背景板。
    2023上半年，人工智能的发展似乎到达了一个临界点，世界人工智能大会上呈现出的所有AI产物也仅是冰山一角。
    根据不完全统计，目前国内发布的大模型数量已过百，但更多集中在C端，针对B端的行业大模型仍在少数。大语言模型的产业商业化之路还很遥远。
    不免思考的一个问题是：我们距离AGI的路到底还有多远？
    在本届WAIC大会上亮相了30多款大模型产品，在这其中，不仅有百度、阿里、腾讯为首的互联网厂商阵营，还有以云知声、澜舟科技、商汤科技为首的AI企业阵营，更有以中国电信、中国联通为首的运营商阵营，以及以清华大学、复旦大学为首的学术阵营。
    透过它们的动作，我们试图丈量我们和AI终点的距离。
    【以下为产业家于WAIC现场纪实】
    清华
    大模型在算力、准确性、时效性和隐私保护方面还存在瓶颈。
    在算力方面，如何降低耗能、提高效率是大模型面临的关键问题，它直接决定着大模型未来是否能达到商用水平。如果用在垂直行业，会需要更精准的模型，这要求大模型要有低延时、高安全，并且提供精准信息的能力。然而，目前大模型不仅十分消耗算力，用于专业领域还存在幻觉问题。
    针对该问题，清华大学智能产业研究院张亚勤院长在2023世界人工智能大会（WAIC）上发表演讲，“AI发展需要人才、数据、算法、算力四个方面的支撑，其中算力会是最大的挑战。目前GPU市场由英伟达主导，很多其他公司虽然也在做，但仍然不能满足大模型发展的需求。在这一点上，需求是创新的源泉，如果未来算力成为了关键“卡脖子”因素，那我们就需要寻找新的模型和算法，或者新的计算平台，以降低计算成本并提高效率。”
    百度
    百度CTO及应用国家工程研究中心主任王海峰在会上对文心大模型3.5版核心技术进行了全面解读，并结合百度发布的飞桨生态，阐述了人工智能产业模式。
    在王海峰的介绍中，文心大模型3.5有三大技术创新。
    一是对先进生产力的期待，文心大模型3.5在模型效果、安全性和逻辑推理均有提升；二是对行业专家的期待，通过“精调”+“知识点增强”两大技术创新，新版本让大模型具备行业专家一样的专精能力；三是对丰富应用的期待，比如通过插件机制扩展大模型的能力边界。未来，文心一言将发布更多优质的百度官方和第三方插件，帮助开发者基于文心大模型打造自己的应用。

    王海峰在致辞中提出，大模型的产业模式将是“类台积电”模式。“以台积电、三星等企业为例，芯片制造工艺有很高的技术壁垒、价格高昂的产线，能够根据客户需求，标准化、自动化地大批量生产芯片，形成规模经济。同理，大模型生产企业在大模型能力、海量数据、大规模算力等方面具有优势，能够根据AI应用方的需求，自动化、标准化地进行多场景多领域的模型生产，当达到一定规模时，即可形成健康、可持续发展的大模型产业模式。”
    大模型的“类台积电”产业模式，已经在百度的大模型实践中得到验证。百度研制了文心产业级知识增强大模型系列，其背后又有飞桨的有力支撑。飞桨将集核心框架、产业级模型库、开发套件和工具组件，以及学习和实训社区于一体，标准化、自动化地支撑大模型生产和应用。
    阿里
    其次，阿里云作为业内最早布局大模型的科技公司之一，在本次的WAIC大会上迈出了多模态能力的关键一步。继通义千问之后，阿里云宣布AI绘画创作大模型通义万相开启定向邀测，该模型可辅助人类进行图片创作，未来可应用于艺术设计、电商、游戏和文创等应用场景。目前，该能力将逐步向行业客户开放。
    阿里云智能集团CTO周靖人对于多模态的理解是，“多模态是大模型演进的必然路径，我们希望用不同模态的能力服务千行百业，帮助企业全面拥抱智能化时代。”

    此外，阿里云在本次WAIC大会上的另一个靶点是，通过「魔搭社区」，为大模型创业公司提供全方位的服务，从而搭建一个“大模型自由市场”。
    周靖人表示，“在魔搭这个自由市场，所有模型生产者都可上传模型，验证模型的技术能力，探索模型的应用场景和商业化模式。而阿里云将提供智能算力和开发工具，并在资金和商业化探索方面提供充分支持。”
    在本届世界人工智能大会上，一个值得关注的重点是行业大模型的发布。此前，大模型都是主要集中在C端的通用大模型，因此在本届WAIC大会上几家行业大模型的亮相备受瞩目。
    腾讯

    会上，腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生对于行业大模型发表了看法，“通用大模型有很强的能力，但并不能解决很多企业的具体问题。企业的大模型应用需要综合考虑行业专业性、数据安全、持续迭代和综合成本等因素。基于行业大模型，构建自己的专属模型，也许是企业更优的选项。”
    在数据精准性和隐私安全问题上，企业可以基于行业大模型，再加上自身数据进行精调，从而构建专属模型。这样打造出的模型参数比通用大模型少，训练和推理的成本更低，模型优化也更容易；另外，行业大模型和模型开发工具，也可以通过私有化部署、权限管控和数据加密等方式，防止模型训练和使用带来企业敏感数据的外泄。
    另外，腾讯云智能和腾讯优图实验室在现场重点展示了小样本数智人、刷掌支付、腾讯同传等互动体验项目。比如小样本数智人依托于腾讯自研AI能力，只需要3分钟真人口播视频、100句语音素材，平台便可通过音频、文本多模态数据输入，实时建模并生成高清人像，在24小时内制作出与真人近似的“数智人”。
    在作曲方面，腾讯实验室拿出了自研的XMusic通用作曲框架，被称之为本届世界人工智能大会的“镇馆之宝”。该XMusic生成式通用作曲框架使基于AIGC技术，支持视频、图片、文字、标签、哼唱等多模态内容，作为输入提示词，生成情绪、曲风、节奏可控的高质量音乐。
    华为
    关于行业大模型产品，在本届大会的另一个重磅发布则是华为的盘古大模型3.0。
    华为以“不作诗，只做事”为口号，推出了以B端市场作为目标的大模型产品。
    此前，在国内互联网企业热衷于“百模大战”之时，华为并没有恋战，而是相继发布科学计算大模型、药物分子大模型、盘古矿山大模型和气象大模型。其中，盘古气象大模型的研究成果还在《Nature》正刊上正式发表。
    在《Nature》期刊上，华为云盘古大模型团队基于三维神经网络的气象预报系统精度，研发出高分辨率全球AI气象预报系统，这种方法超过传统数值预报方法，且速度提高了1万倍以上。而就在2022年末，国际气象领域的专家教授们还普遍认为，AI要达到传统数值方法的精度，是一件非常遥远的事。

    华为常务董事、华为云CEO张平安在发布大模型时透露，目前，“盘古大模型已在金融、制造、医药研发、煤矿、铁路等诸多行业发挥巨大价值。”
    中国电信
    此外，中国电信也针对政务、司法、教育、医疗和通信等垂直行业推出领域大模型TeleChat。在发布会现场，中国电信展示了大模型赋能数据中台、智能客服和智慧政务三个方向的产品。

    中国电信数字智能科技分公司何忠江副总经理针对大模型与行业融合，并解决幻觉问题做了阐释。
    首先，大模型为什么会出现幻觉？实际上，大模型生成的词句是依据概率逐字推理的方式得出，而这种概率矩阵的方式必定会出现幻觉问题。对此，中国电信在设计大模型的过程中，用一定技术改善了概率矩阵出现的幻觉问题。另外，将行业知识与大模型融合，从而增强大模型的预训练和推理能力。
    可以说，在消除幻觉问题方面，电信TeleChat大模型做出了先人一步的创新。
    京东
    在AGI时代浪潮席卷而来的当下，多家厂商都表示，大模型的下一步是走向多模态。7月13日，京东重磅发布了言犀大模型。自此，百模大战又添一员。从发布会现场来看，京东的言犀大模型更注重产业侧，“从产业中来，到产业中去”也是京东对外宣传的一句标语。
    京东凭借多年来在供应链侧沉淀的数据信息，将言犀大模型的定位置于供应链端。“只有将供应链做透，才能将大模型做实。”京东集团技术委员会主席、京东云事业部总裁曹鹏表示，数智供应链，是大模型走向产业应用的着力点，大模型要以数智供应链为抓手，走向产业，深入实体。

    京东为了给大模型注入产业能力，输入了大量的专业数据，其中包含70%的通用数据和30%的数智供应链原生数据。这些数据的背后，是京东为大模型提供的巨型训练场。发布会现场，京东CEO许冉表示，“大模型真正实现自己的价值，一定是在产业应用中。”
    网易
    在本届WAIC大会上，网易也携多款AI大模型落地产品进行展出。在工业、教育、游戏、音乐和元宇宙领域，网易都推出了不同行业的大模型，应用到各大场景。
    比如在工业领域，网易伏羲基于AOP理论思想及自研工业大模型，推出国内首台无人装载机器人和挖掘机器人，参与到矿山、铁路等一线场景的建设；在教育领域，网易自研的国内首个教育大模型“子曰”最新应用成果——虚拟人口语教练首次亮相。

    在此前网易发布一季度财报的电话会上，网易CEO丁磊对于大模型也发表了自己的看法，“在AI大模型竞赛中，真正的胜者是能选择好应用场景的企业。”
    从网易一季度财报来看，在AI大模型等自研关键技术投入上，研发投入37亿元，占总营收比重达15%。而且目前，网易自研AI技术已应用于游戏工业化全流程，AI技术对关键环节的工作效率提升达90%。
    科大讯飞
    在国内大模型的队伍中，科大讯飞的星火大模型从效率和精度的角度看都数一数二。在世界人工智能大会上，科大讯飞展示了星火大模型在教育、办公、汽车、医疗、工业等领域的应用。
    另外，科大讯飞高级副总裁、认知智能全国重点实验室主任胡国平还公布了讯飞与华为的合作。讯飞星火与昇腾AI联合，全力打造通用智能新底座。“国产大模型只有基于中国自主创新的算力底座才有大未来”，胡国平表示。

    在大模型加速迭代赶超的背后，是不容忽视的算力挑战。而讯飞与华为的合作意图，正是让国产大模型可以架构在自主创新的软硬件基础上，打破算力瓶颈。
    中国移动
    在央企大模型的队伍中，除了中国电信的TeleChat大模型，中国移动针对政务和客服，也正式发布大模型：九天·海算政务大模型和九天·客服大模型。

    中国移动的九天大模型首创了“政务大模型-信息场-应用”端到端政务服务体系，一网通办的服务理念将被更加安全、高效地体现在群众的办事体验中。比如对于政府工作人员，通过大模型和信息场的联动，直接用自然语言与数据库中的海量政务数据表和运营分析指令交互，串联多来源、复杂异构的数据表，快速获取数据分析结果。
    商汤
    在AI企业的大模型阵营中，商汤科技也在会上推出 “商汤日日新SenseNova”大模型体系的多方位全面升级，以及在该体系下的一系列大模型产品更新和落地成果。
    此外，商汤也着重介绍并展示了其大模型技术自正式发布以来与产业各方的应用实践，包括商汤绝影最新打造的智能座舱产品和车路云协同交通体系等，以及在金融、医疗、电商、移动终端、产业园区等行业生产实践中的落地应用。

    作为千亿级参数的自然语言处理模型，商汤商量SenseChat 2.0版本突破了大语言模型输入长度的限制，并推出不同参数量级的模型版本。
    商汤科技董事长兼CEO徐立在产品发布环节中讲到：“商汤希望通过‘大模型+大装置’持续推动AI基础设施能力的跃进提升，不仅打造通用能力更加强大的基础模型，也进一步高效融合不同垂直领域的专业知识，构建专业大模型，从根本上降低大模型的下游应用成本和门槛。”
    容联云
    在大会上，智能通讯SaaS企业容联云也发布了大语言模型“赤兔大模型”，面向企业应用的多个垂直行业。另外，为推动企业营销和服务数智化转型，容联云还发布“生成式智能营销服一体化工作空间——机器猫”和“生成式一体化智能客服平台”。

    据了解，赤兔大模型是容联云面向企业应用的垂直行业多层次大语言模型，通过重构智能客服和数智化营销价值，赋能沟通智能2.0时代。基于“赤兔大模型”，企业可以搭建自己的智能客服和数智化营销，完成从“降本增效”到“价值创造”的进化。
    在7月12日的“东风生万物”发布会上，思必驰也带来了DFM-2大模型以及最新创新技术应用成果。据了解，思必驰本次推出的DFM-2大模型，一大特点在于将对话式人工智能与大模型相结合。思必驰联合创始人、首席科学家俞凯曾公开表示，“对话式语言计算大模型为核心的大模型体系是未来。”
    “短期来看，关于需要基于一定背景知识的创作型产业，以及一切刚需AIGC的场景、重视SOP（标准作业程序）的行业，能够快速突破。比如智能写作、文档管理、代码生成、流程管理、甚至游戏NPC等。长远来看，搜索引擎和基于搜索的相关产业，有可能被颠覆。”——财联社安安访谈录《思必驰联合创始人俞凯：ChatGPT是继Alpha Go之后最大的里程碑》
    美团
    在2023WAIC大会上，除了各大企业的大模型产品，还有其他领域的AI技术展示，如美团“无人机”、腾讯云智能的刷掌支付和腾讯同传。
    在大会上，美团展示外卖如何“从天而降”：美团无人机对外发布第四代新机型，该机型研发历时两年多，是专注于城市低空物流配送场景的全新多旋翼机型。

    新机型升级了环境适应能力，可在“零下20度至50度”的中雨、中雪、6级风、夜晚等环境中稳定飞行，能够适应97%以上国内城市的自然环境要求。
    美团高级副总裁、到家事业群总裁王莆中表示，近两年，越来越多的用户倾向于“线上买一切”，且对配送时效的要求愈发严格，通过搭建空地一体的立体化城市配送网络，美团可以为消费者提供更好的服务体验。
    本届的世界人工智能大会尤其热闹，从大模型到现场“逗狗”，从无人机发布到马斯克脑机接口，都在说明，人工智能的发展正在迈向一个新的阶段。
    然而在这个新阶段，无论国内外，都正在受到不同层面的约束。比如国内外大模型的“团战”受算力影响尤为严重。具体来讲，研发和使用大模型都需要耗费GPU卡。而目前，GPU卡的费用不断上升。找到能够降低算力损耗的算法是当务之急，只有解决了算力问题，才能离大模型的商业化之路更进一步，等等问题，都在成为当下限制我们想象力的关键因素。
    不难看出，尽管如今各家都发布了大模型产品，但真正聚焦到产业、聚焦到工程落地的产品并不多，在接下来的一年里这也将成为新的大模型衡量标准。
    我们常说的一句话是，“我们总是高估的当下1年的变化，总是低估了未来10年的变化。”在AGI注定要奔涌而来的如今，期待大模型能尽快成为中国产业数字化浪潮的新密码。