激荡2023：数智化千帆竞发，未来何处发力？

2024.10.10 商业秀

文｜郑久宇   编｜杨肖若出品｜商业秀

    去年此时，科技圈几乎都沉浸在AIGC元年带来的技术新浪潮之中，如今从AI技术当前发展阶段来看，AIGC的确给很多社交玩法以及商业模式带来了新的启发。这一年，「商业秀」和旗下的视频栏目「一览弘观」也做了很多和数字化、智能化以及AI大模型相关的图文和视频，来记录这个被AI影响和推动变革的商业时代。
    本期我们推出第一篇科技行业总结，主题是——激荡2023：数智化时代千帆竞发，未来何处发力？“千帆竞发”，基本概括了2023年这一年来国内外科技企业的竞争态势；何处发力，主要指的是这些AI技术和大模型，到底能在哪些具体领域和场景落地、开花和结果。如果展望2024年及未来科技行业发展的十年，数字化和智能化依然是很重要的主线。
    数字化层面，我们应该更关注数据要素全产业链，公共数据及企业数据的价值显现，以及数据交易对数据价值的提振；智能化层面，应该关注 AI 视频，以及AI赋能端侧带来的产业机遇。
    01挖掘数据的乘数价值
    在我国，数字经济已经成为发展最快、创新最活跃、辐射最广的经济活动。根据中国信通院统计，2022年我国数字经济规模达到了50.2万亿元，同比增加约4.7万亿元占到GDP比重的41.5%，可见它对咱们国家经济的重要。2023年3月，中共中央、国务院印发《党和国家机构改革方案》，部署组建国家数据局，负责协调推进数据基础制度建设，统筹数据资源整合共享和开发利用，统筹推进数字中国、数字经济、数字社会规划和建设等，由国家发展和改革委员会管理。
    10月25日，国家数据局正式揭牌。国家数据局局长刘烈宏提出“数据要素×”行动，推动数据在不同场景中发挥出千姿百态的乘数效应。随后的2023年下半年，上海、福建、广西、广东、无锡、海南等多地区密集出台数据要素市场发展的相关政策，进一步明确数据要素产业的发展目标，完善当地数据要素市场基础制度体系建设。而就在2024年1月初，国家数据局等17部门联合正式印发《“数据要素×”三年行动计划（2024—2026年）》，正是为了推动数据在不同场景中发挥乘数效应。

    来源：国家数据局
    众所周知，数据要素作为生产要素之一，其投入生产的途径可以概括为三次价值释放的过程。其中，数据要素的第三次价值释放是流通赋能，也就是让数据流通到更需要的地方，让不同来源的优质数据在新的业务需求和场景中汇聚融合，实现双赢、甚至多赢的价值利用。此外，数据流通可以打破“数据孤岛”，满足数据供需双方的价值需求，而数据交易是实现数据要素三次价值的重要手段。

    数据要素的三次价值释放。来源：中国信通院
    未来，如果想要实现数据要素的三次价值，就必须通过数据交易。毕竟，数据的交易流通能进一步释放数据要素的价值。在政策的推动下，全国多地加入数据交易链，启动“可信通”计划，实现“一地挂牌、全网互认”，推动全国多层次数据要素市场实现互联互通。而随着国际数据产品挂牌数交所，我国数据交易也进一步迈向国际化。如今政策已经提供了足够多的支持，接下来就要看各行各业如何去加速数据价值的释放。

对于企业而言，在利用数据进行商业价值的进一步挖掘层面依然面临着一些挑战。

首先，企业应用大数据分析最大的挑战是存储、分析和数据的维护，这需要专业的团队；其次，数据整合仍是当今企业面临的挑战，一是数据收集的来源多，很难整合到同一个数据库中，二是数据具有时效性、变化快，这就要求企业要有一个强大的收集系统；再次，大数据的安全性一直是不可避开的挑战。尤其是在AI时代，数据安全成为一个更复杂的课题。
    02全球AI大模型“千帆竞发”
    自2023年3月以来，随着以ChatGPT为代表的生成式AI引发新一轮科技浪潮，国内有超过20家的互联网企业竞相推出大模型。据不完全统计，国内10亿以上参数规模的大模型已发布了79个。到7月6日的2023世界人工智能大会，更可谓“百模争流”，甚至形成了“千模大战”之势，可与当年互联网发展时期的“千团大战”相媲美。同时，国内监管也跟上发展的步伐。2023年5月23日，国家互联网信息办公室2023年第12次室务会会议审议通过《生成式人工智能服务管理暂行办法》。
    2023年7月，国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》（下称“暂行办法”），自2023年8月15日起施行。《暂行办法》提出对生成式人工智能服务实行包容审慎和分类分级监管，明确了提供和使用生成式人工智能服务的总体要求，提出了促进生成式人工智能技术发展的具体措
    施，还规定了安全评估、算法备案、投诉举报等制度，明确了法律责任。《暂行办法》的出台，有利于规范AI大模型的商用环境，推进AI大模型在各领域的应用落地。通过审批上线、向全社会开放后的大模型将在更严格的监管环境下运行，同时也需要满足更多的合规性和安全性要求。截止2023年11月底，我国有20余家AI大模型已备案，多家宣布要面向全社会开放部分功能的服务。
    其中8月31日，首批8家通过备案的AI大模型包括百度的“文心一言”、百川智能的大模型、商汤科技的“商汤商量SenseChat”、抖音的“云雀大模型”、智谱AI的“GLM大模型”、中科院的“紫东太初大模型”等。9月20日，360公司的“360 智脑”也获批开放。
    自2023年11月4日以来，国内共11家公司的AI大模型产品获批，包括网易有道的“子曰”教育大模型、面壁智能的“面壁露卡 Luca”、昆仑万维的“天工”大模型、美团的“美团模型”、知乎的“知海图AI”模型、金山办公的“WPS AI”、蚂蚁集团的“百灵大模型”以及360公司的“奇元大模型”等。随着国内各大厂商的AI大模型完成备案，我国的AI大模型应用有望进入加速落地期。
    这也意味着，整个行业卷到了落地应用阶段。尤其是首批向公众开放的大模型产品，会在用户拉新方面占据一定先发优势，同时随着To C落地场景的开放，大模型产品在商业化想象空间上也被放大。麦肯锡《生成式人工智能的经济潜力：下一波生产力浪潮》报告显示，如果将分析的63种生成式AI应用于各行各业，将为全球经济每年带来2.6万亿至4.4万亿美元的增长，而且这一预测还未将所有的生成式AI应用计算在内。
    有分析称，如果将尚未研究的应用计算在内，生成式AI所产生的经济影响可能会翻倍。对于中国的大模型而言，在经历了备案合规后，2024年也将迎来落地应用、百花齐放的最好时代。放眼海外，2023年11月7日，OpenAI召开了首届开发者大会，数据显示，ChatGPT目前每周有超过1亿活跃用户，有约200万开发者使用API等进行开发，与超过92%的财富500强公司合作。
    OpenAI 与谷歌相继推出新品，GPT-4 Turbo提速减价，降低使用成本。与GPT-4相比，GPT-4 Turbo输入token价格降低了3倍，输出token价格降低了2倍，综合费率比GPT-4便宜了超过2.75倍。同时，GPT3.5 Turbo在16k的成本也降低了。
    推出GPT-4 Turbo，六大方面实现更新。在开发者大会上，OpenAI推出了全新的GPT-4 Turbo模型，并在上下文长度、新模态等六个方面实现了更新，让OpenAI的产品在性能大幅提升的同时降低了使用门槛，版权盾的引入还提升了用户使用产品的安全性。2023年12月6日，谷歌CEO官宣了Gemini 1.0版的正式上线。
    Gemini大模型是原生多模态大模型，目前Gemini1.0有三个不同的版本：Gemini Ultra：规模最大、能力最强，用于处理高度复杂的任务；Gemini Pro：在各种任务上扩展的最佳模型，适用于多任务；Gemini Nano：用于端侧（on-device）任务的最高效模型，适用于特定任务。
    此外，根据谷歌自身对Gemini Ultra版本的测试，Gemini Ultra的测试结果大幅提升，其中在MMLU（大规模多任务语言理解数据集）中的得分率高达90.0%，首次超越了人类专家。在开放模态中，国产大模型在自然语言处理、机器翻译、智能客服、智能推荐等各领域得到了广泛应用。但大多数模型依然聚焦在对话、问答、写作、代码和图片的生成层面上。
    如果说，过去的一年，国产大模型一直处于追赶ChatGPT的状态。那么接下来，追赶的节奏恐怕要加快一些，并且还需要针对不同场景进行定制化开发和应用。因为，2024年也是国内大模型走向商业落地的关键一年。

    03AI+视频领域竞争加剧
    如今，AI视频领域竞争正在进入白热化阶段。Runway在不到一年的时间内相继推出了Gen-1。近期，RunwayGen-2也发布更新，生成视频的清晰度可达到4K，视频质量明显提升。而Meta在2023年11月，Meta就一连解锁两个重磅研究Emu Video和Emu Edit，为此前发布的多模态模型Emu的变体。
    其中，Emu Video是一种基于扩散模型的文本到视频生成方法，能够基于文本生成512x512的4秒高分辨率视频，在生成质量和文本忠实度上表现较好。经过Emu Video处理过的视频，具有高度的风格化，当图像动起来、添加运动之后，一切变得如此栩栩如生；Emu Edit可以仅仅基于文本指令就对图像进行编辑，通过识别和生成任务，编辑得格外精确。
    Emu Edit对于指令遵循得如此精准，以至于能确保输入图像中与指令无关的像素保持不变。这两个新研究的发布，让Meta的多模态模型性能大幅提升，在AI视频领域刻下新的里程碑。2023年11月29日，美国AI初创公司PikaLabs发布了重磅产品Pika1。
    在Pika1.0中，通过文字就能够生成非常贴近且生动的视频。不仅如此，使用图片、视频还可以对它们进行“再加工”，可以根据已有的素材直接扩展视频，生成不同高宽比的内容，还能够支持对于视频的实时编辑和修改等，几乎对标Runway家族现有的所有功能，现已开启申请试用。
    Pika1.0核心功能首先包括文生视频，即语意理解能力、生成视频的连贯性和清晰度表现较好。时长方面，目前生成视频的时长为3s，暂落后于竞品Runway，Runway在8月的更新中将生成视频最高时长从4秒延长至18秒。
    回到国内，多个AI视频工具也取得了重要进展。比如字节团队推出视频生成新方法PixelDance，可在生成视频中实现较好的动态性；并计划在未来数个月内推出产品；Stablilityai推出视频生成工具StableVideoDiffusion，支持文本到视频、图像到视频生成；2023年12月5日，美图发布了MiracleVision4.0版本，将于今年1月开始逐渐支持美图旗下各产品，主推AI设计与AI视频两大能力。
    可见，AI生成内容竞争已经开始从文本和图片生成，转向了视频生成。随着技术突破，AI视频生成技术将在短视频、短剧等行业带来更多新的可能性。
    04AI+PC及智能驾驶成重要的落地场景
    随着AI大模型面向行业应用多点开花，金融、交通、医疗等重点领域厂商纷纷发布行业大模型，推进了AI 大模型在行业端的赋能落地。而AI 赋能终端，端侧应用遍地开花，AIPC及智能驾驶也成为重要场景。比如多家手机厂商将AI大模型引入端侧，AI+PC多方面适配。
    相较于云侧，AI大模型在端侧的应用具有较低的时延性，且本地部署还能够更好地保障数据的安全性。在手机端，各大智能手机厂商纷纷将大模型引入智能手机，AI端侧应用也遍地开花。比如荣耀Magic6官宣搭载自研的7B端侧AI大模型；小米升级小爱大模型，表示目前手机端侧已经初步跑通；华为宣布手机系统接入盘古大模型，开启内置大模型的语音助手小艺的众测，vivo、oppo也纷纷官宣自研大模型，表示推进自研大模型在端侧的应用。
    电脑端，在2023年度Tech World大会上，联想集团展示了首款AI PC，并表示AI PC将是能够创建本地知识库，运行个人大模型，支持人工智能计算，运用自然交互的更强大、更具创造能力的智能生产力工具。联想集团与英特尔公司、爱奇艺三方还签署了合作备忘录，将在AIPC领域展开深度合作。PC与AI大模型在多方面都具有很好的适配性，将会是AI大模型在端侧应用的核心落地成果。
    智能驾驶是AI大模型在端侧应用的重要场景。比如特斯拉推出全新的端到端AI自动驾驶系统，并在2023年11月提出已开始向员工推出全自动驾驶（FSD）V12版本。马斯克在此前的试驾直播中表示，FSD Beta V12是有史以来第一个端到端AI自动驾驶系统（Full AI End-to-End），从头到尾都是通过AI实现，没有编程，没有程序员写一行代码来识别道路、行人等概念，全部交给了神经网络自己思考。
    而且，V12的C++代码只有2000行，而V11有30万行。2023年11月底，鸿蒙智行首款轿车智界S7正式发布。智界S7率先实现HarmonyOS 4上车，在个性玩法、高效性、智慧能力、流畅性、安全隐私等各方面再次突破；车载智慧助手小艺拥有华为盘古大模型加持，成为可靠的私人用车顾问；智界S7搭载持续进化的HUAWEI ADS 2.0高阶智能驾驶系统，还在业界首发泊车代驾功能，解决用户多处痛点难点。
    如今，很多车企都把精力放在了智能驾驶上，智能化成为一家车企最核心的竞争力之一，而智能驾驶的成熟和落地，不仅依赖高效的算力、完善的算法模型和大量高质量、安全无偏差的数据，还需要科技企业的跨界助力。2023年，随着汽车圈+科技圈的组合不断增加，接下来合作共赢才是智能驾驶规模性落地的最佳出路。
    结语数智化是未来发展的主线
    进入2024年以及接下来的五年，科技行业依然要把握数字化和智能化主线。数字化层面，要挖掘数据要素全产业链、公共数据运营、企业数据价值显性、数据交易所互联互通以及国际数据产品挂牌带来的机遇；而智能化层面，要关注新模型推出对 AI 产业链需求的整体提振、AI 视频领域的突破对AIGC带来的影响、国内 AI 大模型的加速落地，以及 AIPC和智能驾驶产业链的机遇等。