掘金AIGC时代，开发者更需要什么样的大模型？

2024.09.04 智能进化论

作者|小葳
    出品|智能进化论

    当前，火热的AI大模型领域需要一些冷思考。
    自去年年底ChatGPT掀起一轮AIGC热潮以来，国内科技企业扎堆发布大模型和类ChatGPT产品。截止2023年4月，已公开宣布发布或即将发布AI大模型的企业达数十家。多模态大模型的能力不断迭代，市场竞争加剧，同时监管意见及时出台，多重因素叠加让AI行业格局处在飞速变化中。
    如何让大模型更广泛深入落地，在更多场景中把大模型的能力真正用起来，一直是AI产业界关注的焦点。当国内大部分大模型还停留在早期产品发布阶段时，2021年便问世的源大模型已经探索出了大模型商业落地的新路径。
    1 老上海弄堂与AI大模型的碰撞
    “怎么办理共有产权保障房？”
    “失业补助金能领几个月，一个月多少钱？”
    “养狗办证在哪里办，多少钱？”……
    很多人以为，AI大模型更适合用来进行前沿科技等高大上的项目，其实不然。AI大模型的落地应用，也可以非常接地气。
    2022年10月起，上海市静安区临汾街道的社区工作人员，在日常工作中已经用上了国内首个政务领域AI对话机器人“临小助”。
    “临小助”是基于2457亿参数的源大模型开发而来，它系统学习了民政、人社、房管等15个部门数百项服务类政策文档。工作人员只要在微信中向“临小助”提问，马上就能得到“正确答案”，即使是刚入职的社区小白也能“秒变”服务能人。
    不仅如此，“临小助”还是社区培训的好助手。在社区治理高频情景中，“临小助”可以随时“扮演”群众，通过互动对话形式为社区工作者提供工作能力培训。目前“临小助”已经开设了加装电梯、业委会换届等8堂培训课程。
    过去，需要数月时间的线下培训，通过“临小助”只要短短十分钟就能完成。试用阶段显示，某高频场景中，“临小助”让社区工作人员培训学习效率提升5倍，有效辅助问答建议达75%。

    不过，比AI大模型深入弄堂更值得关注的是，“临小助”并不是科技公司推出的产品，而是源大模型开发者社区的开发者利用业余时间探索的应用。
    2022年疫情期间，来自微软、百度、HTC等科技公司的几名AI开发者，希望通过AI技术减轻社区工作者的负担，开源的源大模型让他们仅利用业余时间就快速完成了产品开发与测试上线。
    目前，“临小助”已落地上海多个街道社区，为众多基层社区工作者减负增能的同时，也为几名开发者带来了创业的第一桶金。
    一直以来，人少事多是传统社区基层治理的核心难题。以上海为例，每个居委会通常由5~9人组成，但需要对接3500~5000名居民，平均每人要对接400~500人，日常工作多达119项。“临小助”这样的AI应用，对于数字政务和社区治理场景，有巨大商业价值和前景。

    “临小助”并不是个例，在源大模型开源社区，另一批开发者积极探索“大模型+数字人”领域，在GitHub上推出了“一键构建专属你的数字人”的数字人生成平台Fay，也是优秀的大模型商业化探索案例。
    Fay的最大价值在于，将语音识别、情绪分析、NLP处理、语音合成、表情动作输出等数字人核心模块做模块化处理，企业可以根据自身需求，像搭积木一样便捷地构建个性化的数字人助理。基于数字人生成平台Fay，深圳某公司打造了平板产品中的数字人个人助理，某主打情感陪伴的玩具公司也将开发的数字人融入到儿童玩具产品中。
    当普通大众还在对AI将取代哪些工作感到焦虑时，越来越多AI开发者已经在利用大模型掘金。
    那么，这些开发者是如何在短时间内就开发出具备商业价值的AI应用的？这就不得不提到现阶段大模型的商业模式。
    2 “中国版ChatGPT”，离商业落地还有多远
    ChatGPT是这一轮AIGC热潮中，最火爆的杀手级AI应用。相比产品与技术的迭代，AIGC新技术能否找到可持续可落地的商业模式也是产业界关注的重点。目前，国内国外类ChatGPT产品的商业模式大致有两种路径：
    第一种模式：按使用量面向用户收费。如ChatGPT Plus、AI绘画平台Midjourney等，通过购买包月套餐，用户可以获得更快的生成速度和更高的内容生成质量。或者通过按API调用量付费，开发者可以基于基础模型进行个性化开发。
    虽然ChatGPT短时间内吸引了全球一亿用户，但OpenAI仍是一家亏损中的创业公司。用户付费带来的收入，与前期巨大的研发投入和持续的算力消耗相比，让OpenAI何时盈利仍然是未知数。在算力成本方面，根据国盛证券报告《ChatGPT需要多少算力》估算，GPT-3训练一次成本约为140万美元，GPT-4的训练成本更是只多不少。
    第二种模式：面向企业提供解决方案，这也是国内AI企业锚定的主要盈利模式。针对具备一定开发能力的企业，AI平台可以提供API接口、开发工具套件等，支持企业自定义开发自己的AIGC产品。针对更广泛的上游应用行业，则提供开箱即用的、相对通用化的AI应用。
    然而，自大模型诞生以来，如何深入行业、场景一直是行业痛点。无论中外市场中，真正具备打造AI基础设施平台实力的企业不多。更多的企业，面临的关键问题是：如何将大模型的能力更好地与自身业务相结合。
    这也是当前面对火爆的大模型领域，很多企业客户保持冷静观望的原因。一位头部企业级SaaS公司的高管向「智能进化论」透露，目前很多SaaS企业都在同时与多家国内AI平台企业接洽，他们最关心的是大模型究竟能为企业客户带来多少价值，毕竟各家大模型的实际效果还有待验证和评估。如何将平台的AI能力在自己深耕的领域用到最好，成了关键。
    在上述两种主流的商业模式之外，源大模型则开启了另一条路：更彻底的开源。

    2021年问世的源1.0大模型发布时便问鼎全球最大规模的中文AI模型，其参数规模高达2457亿，训练采用的中文数据集达5000GB，无论参数量还是数据集规模都比当时的GPT3领先不少。
    开源开放是源大模型最具差异化的优势之一。为了降低AI开发门槛，源大模型开放平台已经向开发者开放：模型API、开源高质量中文数据集、模型训练代码、推理代码、应用代码、面向AI芯片的模型移植开发代码等资源。在开放平台的基础上，开发者无需从零开始，仅需完成少量代码就可以快速构建面向各种细分场景的AI应用。
    目前，源大模型开放平台已汇聚超4000名行业开发者，覆盖互联网、金融、教科研、自动驾驶等领域。前面提到的“临小助”和数字人生成平台Fay都是在源大模型开源社区诞生的。而在开源大模型出现之前，个人开发者是不可能在这么短时间内开发出具备成熟商业价值的AI应用的。
    为了帮助更多开发者便捷、高效地开发AI应用，源大模型还推出了丰富的开源开放平台和工具，比如APIExp工具可以让开发者直接通过网页与大模型交流，支持零代码调用和测试所有已开放的模型服务。Web应用Sandbox（沙箱）开发工具，让开发者仅修改少量代码，即可完成包含web交互的应用示例，快速验证业务逻辑和功能效果。
    3 大模型时代，“安卓生态”初探
    AI技术在不断向着祛魅和普惠的方向发展。ChatGPT及其背后的大模型只是这个过程中的一个关键节点。
    过去，AI开发是作坊模式，一个场景一个模型，门槛高、周期长、成本高，AI开发只是少数实力雄厚的大公司才具备的能力。
    大模型的出现改变了这一局面。将通用性和泛化能力强的大模型，经过下游场景微调，就可以批量产出适配各行各业的AI模型。大模型让企业及个人开发AI应用的成本和难度大大降低，这也是科技巨头纷纷布局大模型的核心原因。
    下一阶段，AI开发新范式将进一步迭代，突破的关键在于如何激活千千万万开发者的创造力。

    回顾移动互联网为代表的上一轮科技革命，开源的安卓系统，撬动了全球范围内开发者的无限创意，最终形成了移动互联网生态的繁荣。
    在AI行业内，源大模型开放平台也在朝着“安卓生态”的方向加速进化。
    首先，源大模型的开源程度是业界领先的，同时提供了完备的开发工具和平台，可以将AI开发门槛进一步降低，从而汇聚千行百业开发者，激发他们创新的势能。
    其次，基于开源的基础模型，开发者可以开发出适合各种场景化的商业应用。基础模型相当于安卓系统，开发者开发的场景应用类似于安卓系统之上的各种APP，二者相互协同，相互促进，正在形成不断壮大的发展模式。
    目前，靠开发者自发的力量，源开发者社区已经开发上线了数十款AI应用，包括AI剧本杀、反诈AI、心理咨询师陪练、数字演员、正能量陪伴机器人、抬杠机器人、游戏NPC对话、文案写作、金融文本分析等。
    与企业主导的商业AI应用开发不同，源大模型充分释放了AI开发者的奇思妙想，极大提升了AI应用的丰富性和多样性。也让很多人第一次意识到，AI大模型其实可以深入很多生活工作的细分场景。
    AIGC时代，创新的能力已经交付到每一个有创造力的个人手中。
    如果说，大模型为AI技术深入千行百业打下了技术基础，那么源大模型对“安卓生态”模式的探索，开启了激活AI应用生态的路径，也让AI有机会飞入寻常百姓家。
    ***
    作为AI开发者，如何借助开源大模型快速赚到创业第一桶金，赢在AIGC时代？
    文中图片来自摄图网
    END
    本文为「智能进化论」原创作品，