周鸿祎，在大模型上下了盘大棋

2024.09.24 数字力场

    文 | 佘宗明
    想用AI再造一个新360的周鸿祎，先用认知型通用大模型360智脑4.0再造了一个“周鸿祎”。
    在距离“把刚出生的婴儿抱出来看一看”2个多月后，周鸿祎秀出了新花活——他用“凑齐部分资料，召唤出一个有灵魂的数字人‘周鸿祎’”的新奇玩法，对AI大模型摁下了重新定义按钮。
    在很多人眼中，大模型的应用入口，不外乎以搜索栏、对话框为主的图形用户界面（GUI）。
    可在周鸿祎看来，360在大模型上的核心创新在AI数字人，数字人是未来AI大模型最重要的应用入口。
    将AI数字人作为未来的应用入口，背后是360智脑大模型在应用场景拓展上下的一盘大棋。
    很明显，这一次，周鸿祎已下定决心要玩把大的。这位自带“我已不做红衣大炮很多年”BGM的科技大佬，准备梭哈了。
    结合360智脑4.0面世后的表现，或许可以脑补这番场景——

    百模大战，好戏连台。
    文心一言率先开麦：想唱就唱，要唱得响亮……
    通义千问也清了清嗓子：是谁抢走了我的麦克风……
    还没唱完，台下又有清亮的歌声传出：我就是我，人群中不一样的烟火。
    大家循声望去，开嗓的是360智脑。
    都是大模型，你怎么就不一样？众人问道。
    只见360智脑甩出了一堆AI数字人，说：来，感受一下。

    正当大家觉得好玩之时，360智脑又来了场“个人秀”。
    它秀起了技术：作为国内少数持续深耕人工智能核心技术的公司，360早就开启了多模态跨模态技术应用及NLP等大模型核心技术探索，有强大技术积累；作为国内第二大搜索引擎厂商，360可以用搜索优化补足GPT实时性和准确性不足的能力短板，有搜索增强优势；作为全球首个大模型安全风险评估体系“AISE”的受创者，360承接了安全大脑 - 国家级人工智能开放平台项目，有大模型安全赋能能力。
    它秀起了场景：360是国内唯一拥有可与微软“全家桶”比肩的互联网全端应用矩阵的公司，拥有在中国搜索引擎市场位居Top 2、市场份额为35%、日均请求量超10亿次的360搜索，拥有MAU超4亿的360浏览器，横跨PC端、移动端、物联网15亿终端的搜索、安全、内容等多形态产品覆盖，为AI大模型落地提供了土壤。正因如此，360被业界认为是A股唯一一家能够结合场景做大模型的公司。
    它还秀了战略，八个字可以将其概括：两翼齐飞、四路并发。

    ▲360大模型战略图示。
    如果你对这高大上的概念不明觉厉，那360的“近中远”三期目标，可以为你理解360智脑的战略提供切口。
    近期，360将加速大模型的C端场景落地，推出一系列C端应用，把全家桶产品植入360智脑4.0；
    中期，360智脑将四路并发，开拓中小微、政企、行业客户，探索大模型增量市场；
    远期，360将开启AI数字人蓝图，让大模型深入每家企业每个人的多元场景，打造有灵魂的数字人。
    看清了近中远三个维度的目标，会发现：360智脑跟周鸿祎一样，都不简单。
    01
    近期着力加速C端场景落地，着眼的是推动AI普惠，也是大模型优化。
    生成式AI，到底是替代人类，还是辅助人类？ChatGPT问世后，不少人的“生存焦虑”由此燃起。
    人们希望答案是后者，又害怕结果是前者。
    如何让AI尽可能地辅助而非替代人类？
    在“AI不会淘汰人类，但会淘汰不会用AI的人”的背景下，加强AI普惠，是绕不开的解题思路。
    普惠包括两层意思：普及，增加大模型产品对C端用户也即普通人的可及性；惠及，降低大模型产品对于他们的使用成本。
    对应的要求是，主要大模型厂商要面向C端，打造可以低门槛获取的个人用户全能AI助手。
    阿里在C端发力，将“通义+天猫精灵”接入淘宝、天猫、饿了么、盒马等应用，形成整合一体的家庭终端入口，可以助力AI普惠；

    ▲阿里此前表示要将旗下全线业务都接入通义千问。
    360将360智脑4.0接入浏览器、桌面和搜索等C端的存量场景，同样能增益于AI普惠。
    深入C端场景，抢占用户心智，反过来也能助推大模型本身的迭代优化。
    过去十多年里，中国互联网能弯道超车，就离不开庞大消费市场托起的丰富落地场景；过去十余年里，AI产业发展裹足难前，也跟应用场景单一的掣肘不无关系。
    AI大模型要发挥“模”力，就必须解决多元场景里的社会痛点。
    周鸿祎此前曾断言，各家大模型能力相差无几，目前没有一家能够遥遥领先、一统江湖，最后能够胜出的决定性因素是“场景”，拥有场景的公司才能在未来的大模型产业竞争中占据领先地位。他认为，AI大模型比拼，在基础能力之外，更重要的是应用场景比拼。
    百度智能云事业群总裁沈抖的说法与之呼应：大模型出现前的AI像是氧气，本身很有价值，但自己不会燃烧，必须找到可燃物才能把价值给发挥出来。落地场景就是“可燃物”。
    C端场景就是应用场景里的重要部分，利用好C端场景丰富度的优势，也许能为中国AI大模型开启追赶GTP-4的“加速度”。
    毕竟，C端有流量。周鸿祎说过，发展大模型的关键是“六大”，即大数据、大标注、大算力、大算法、大模型、大流量，其中最重要的是大流量，大模型只有在用户不断使用和反馈下，才能不断改进。所以360开启了核心算法自研和应用场景拓展“双翼齐飞”模式。
    有了C端用户的大规模应用与高频反馈，大模型的持续迭代会更快。
    02
    中期积极开拓中小微、政企、行业客户，瞄准的是将AI大模型跟实体侧、产业端连接。
    在ChatGPT出现后，很多国内科技大佬都很亢奋：比尔·盖茨笃定“这是40年内最具革命性的机会”，黄仁勋大呼“人工智能的iPhone时刻到来”，周鸿祎断言AI大模型是工业革命级的生产力工具，李彦宏也难掩兴奋地称“AI大模型即将改变世界”，陆奇反复重申“新范式拐点已至”……
    但，如果没有产业端的广泛应用场景支撑，这就是“圈内自嗨”。
    上海交大教授俞凯就说：现在已经面世的大模型，变革在于，基本都已实现思维链的涌现能力，逼近了AGI（通用人工智能）最核心的部分，业界现在更关注大模型是否有足够的“泛化性”，即广泛使用，但从产业角度而言，国内大模型的用户量级也还未达到泛在化。
    “所有行业，都值得基于AI技术重做一遍”的口号，若不能落到助力实体产业上，AI大模型也就是个被吹大的泡沫。
    大数据是“石油”，大模型是“发电厂”，可以把“石油“变成“电”赋能政府、城市、企业和百业千行，是周鸿祎的判断。
    360有意将“新型电力”输送到C端（个人用户）、SME端（中小微）、G端（政企）和B端（行业）。
    细看不难发现，这里面，各方需求并不一样：中小企业需要的不是私有大模型，而是AI驱动的各种实用办公工具；政企可能需要专属大模型，将其变成各业务板块的“副驾驶”，也确保自身信息安全；行业通常需要垂直化大模型，深入垂直行业腹地。
    文心一言与行业头部企业共建11个行业大模型，在能源、金融、航天、影视等领域落地；通义千问对内将钉钉接入大模型，形成B端办公入口，对外提供简化落地难度的MaaS，支持企业通过数行代码调用API并使用Word、PDF等类型文件作为训练数据生成企业或行业专属大模型，都有所指。
    360智脑的做法是：面向消费者端，围绕360浏览器、360搜索、360安全卫士等场景，打造每个人的个人助理；面向中小微企业端，用SaaS化服务为中小微提供生产力工具，如SaaS商店升级AI商店；面向企业/政府/城市端，为其打造私有化部署GPT；面向行业，携手行业伙伴打造行业垂直GPT，打通行业数据，加速行业大模型生产，赋能不同行业场景应用的智能化升级。

    ▲360智脑展示了在城市治理场景中的“视频理解”多模态能力。
    到头来，聚焦用户刚需痛点与自身优势场景下的能力沉淀，也会为360智脑「四路并发」提供厚实基础。
    眼下的360智脑，就相当于举着“国内首个可信AIGC大模型”“能力位居国产大模型第一梯队”的招牌，向那些目标客群招手：快到我碗里来。
    03
    远期铺开AI数字人蓝图，探索AI的终极形态，追求人机协作的极致状态，指向的是让AI大模型更好地服务于所有人。
    在大模型带热了AIGC关注度，数字人又是AIGC对外输出重要产品的当下，数字人已被用在了直播带货等领域，成为降低内容产出成本的途径。
    但现有的绝大多数数字人，没人格没个性，往往只能按既定脚本输出内容。你一看，就知道那是代码生成的。
    依托360智脑4.0的多模态能力，360重新定义了“数字人”：360的AI数字人不是简单“仿生”，而是更接近于数字孪生，特点是有记忆、有人设也有性格，能够复刻思维方式和人生经历。
    听起来有些玄乎，但生成AI数字人却并不复杂：周鸿祎的说法是，“目前看来，难度很低：只要定义好你的人设、背景、说话风格，最重要的是把你的私人资料库收集好。”“用户只需通过将视频上传并解析讲话内容（就能生成数字人）。资料越多，越能模拟生活经历，模拟角色。”
    6月13日的360智脑大模型应用发布会上就披露，360 AI数字人目前拥有200多个角色，分为数字名人（包括历史人物、偶像明星、文学形象等）和数字员工（办公助手）两类。在现场，周鸿祎现场演示了“法务专员”数字人角色如何应对中小企业常见的公章管理和合同审核问题，对方都给予了专业回答。
    看到这，我都忍不住脑补出一副画面：我正被甲方的创意文案策划要求整得闹心，突然想到手边有个AI数字人“佘宗明”，于是对他发出指令，然后一堆创意文案就摆在了我面前，连PPT都不用我动手……
    台上是AI数字人秀出天际，台下是大模型多模态能力各种“兜底”。多模态听着艰涩，说人话就是文生文、文生图、文生表、图生图、图生文、视频理解等涵括文字、图像、语音及视频的处理能力。

    ▲周鸿祎认为，中国自研大模型弯道超车的关键，在于发展多模态。
    为什么ChatGPT之前收到将“鱼香肉丝”“胸有成竹”“夫妻肺片”变成图片的要求后，会生成那些画风诡谲的图片？
    说白了，问题就出在跨模态生成能力上。这其中，若多模态仅是感知层的，那也只能是识别出“夫妻”和“肺”，唯有上升到认知层，才能理解夫妻肺片不是“夫妻”+“肺片”，而是道菜。
    这次360就演示了一把多模态能力，就连在国内首发的“文生视频”多模态功能，都未出现翻车情形，以至于周鸿祎一改此前“国内大模型如果不经过两年模仿，上来就说超越，那叫吹牛”的口径，信心满满地称“国内大模型已基本赶上或接近国际先进水平，之前曾说和全球先进的差距有一两年，今天收回这句话。”
    04
    如果将大模型视作大脑，多模态就是“眼”和“耳”，Copilot之类的则是手脚。360将AI数字人未来的发展方向锚定为能生成声音视频、拥有长期记忆、进行目标分解和规划，还具备执行力……言下之意，就是要让AI数字人既长脑子也有眼耳还有手脚。
    这不免让人想起特斯拉此前发布的人形机器人、苹果最新发布的MR头显Vision Pro，它们的共同延伸话题就是“人机交互”。
    AI技术进步，体现在人机交互上，就是从浅层次的人机协同向进一步的局部自动再向深层次的全程自动演变。体现在智能驾驶上，就是从辅助驾驶向自动驾驶拾阶而上的进化。
    李彦宏说过：过去几十年，人机交互方式发生了三次变化，交互工具先是命令行，后是GUI界面，现在是自然语言。
    以自然语言为基础的AI机器人，完全可以将人机交互的路径缩得更短、效率提得更快。
    在每个人都能通过上传私人知识库低成本生成自己的专属数字人后，许多革命性场景必然伴随而至：AI数字人会成为未来AI世界的基础交互单元，20年前，企业们会去做网站，10年前，会去做APP、两微一抖，到了将来，AI数字人会成为信息沟通传递的载体，甚至可以成为企业的“新闻发言人”——正如AI数字人“周鸿祎”之于360那样。

    ▲周鸿祎的AI数字分身，已成360数字发言人。
    AI大模型的基础价值是带动效率革命。附着在“将互联网最高流量入口、公有云最大市场、新时代的操作系统合三为一”的AI大模型上，糅合了“软件先行定义一切，催生算力硬件需求和后续各类物联网终端变革”特征的AI数字人，就是AI大模型效能进阶的产物：它能在新一代的“安卓”“iOS”系统跟多模态能力的结合中，将AI的提效价值发挥到新的极致。
    值得注意的是，就在昨天，马斯克对AI时代下人类命运的看法——“人类已经是半机器人，因为我们的记忆大部分都外包给了电脑”，上了热搜。“人类是半机器人”的说法，引发了不少人的担忧：这意味着，在对技术工具强依赖之下，碳基生物正在“硅基化”。
    相形之下，AI数字人勾画的景象更有人味：机器人有“灵魂”有“温度”，但最终仍是作为人类的助手，为人类服务。“致敬”今年高考作文题的说法是：要让人类对AI的掌控更好，而不是做AI的仆人。
    AI进化，以人为本，这显然是人们更愿意看到的情形。
    05
    如果要评选当下被用得最烂的科技向口号，那“未来已来”大概就在其列。
    彼得·德鲁克的“预测未来最好的办法就是创造它”，比“未来已来”的抽象描述更真切。
    眼下AI大模型风起云涌。《中国人工智能大模型地图研究报告》显示，据不完全统计，截至今年5月底，中国10亿级参数规模以上大模型已发布了79个。
    虎啸龙吟之下，很多领跑者都想抢先站到未来的制高点上。
    而未来犒赏的，往往是面向未来做好了长期主义准备的人。
    360智脑就布了盘棋局：两翼齐飞、四路并发，将来以AI数字人为入口，撬动“泛在”的应用场景。360以此昭示：它准备好了。

    ▲国内大模型赛道风起云涌。
    周鸿祎以再造“周鸿祎”为路径，再造通用AI时代的360发展路径与产业演进方向，落子思路很清晰。
    至于“一子落”之后是不是“满盘活”，时间会给出答案。
    而看着AI大模型技术和场景创新的火热图景，我们脑海中没准会回旋起那句诗——
    我的时代在背后，突然敲响大鼓。