大模型遇难,周鸿祎纾困
霞光社
作者 | 洋紫
编辑 | 刘景丰站在大模型金字塔尖的OpenAI,日子也不好过了。就在日前,OpenAI的联合创始人之一John Schulman(约翰·舒尔曼)在社交媒体上宣布离职,将跳槽至一家对手公司——Anthropic。同时,OpenAI另一位联合创始人、总裁Greg Brockman(格雷格·布罗克曼)被曝将延长休假时间至今年年底,以“放松和充电”。去年以产品负责人的身份加入OpenAI的Peter Deng(彼得-邓)也选择离开。尽管他们离职原因不详,但多少也反映了当下一些大模型的尴尬——技术正在告别早期的飞速迭代,商业化面临越来越大的压力。
而后者可能更让人焦虑。因为就在上个月下旬,外媒报道,OpenAI正潜伏着一个巨大的挑战:今年将亏损50亿美元——全年收入预估35-45亿美元,而运营总成本高达85亿美元。老大哥都如此,就别说其他的大模型企业了。问题出在哪里?一种主流观点认为:虽然付费订阅贡献了OpenAI主要的年收入,但ChatGPT依然不是一个“杀手级应用”;此外,ChatGPT单个模型的能力也有很大限制。在今年8月1日举办的ISC.AI2024第十二届互联网安全大会·人工智能峰会开幕上,360创始人周鸿祎针对AI应用难题给出了解题思路:第一,要找到明星场景;第二,一个模型未必能解决所有问题,需要多个模型联合工作。周鸿祎宣布,截至2024年7月,360AI搜索已经成为国内流量最大的AI应用。数据显示,360AI搜索的7月用户总访问量也超过了国内一众热门AI应用。看上去,这个难题正在有一个解答的思路。
造大模型难,这是2023年大家有目共睹的事情。自ChatGPT 3.0惊艳亮相,全球就掀起大模型创业热。而国内更是形成“百模大战”的局面。但大模型创业,不同于过去的互联网创业,甚至比几年前的AI创业更难。首先,大模型对技术的能力要求更高,这也是为什么,几乎所有国内大模型的创业者都是AI界最杰出的科学家、创业者;其次,大模型大在参数上,需要巨量的数据和庞大的计算能力,这两者都是极为烧钱的事情。因此,尽管“百模大战”曾一度喧嚣,但真正跑出来的,只有为数不多的头部创业团队的大模型和一些大厂大模型。而今年,大模型的难题,变成了商业化。
当下,随便抓出一个大模型来问,几乎每家都在为商业化焦虑,其中创业团队最甚——就连拿了上百亿美元的OpenAI都如此。根据外媒报道,OpenAI今年运营总成本或达85亿美元,其中,推理和训练成本分别为40亿和30亿美元。如果OpenAI全年收入为34亿美元,则其收支缺口高达50亿美元。对其他创业公司而言,这更是一道困难重重的坎。相比之下,以百度、360、阿里、腾讯等为代表的互联网厂商,目前商业化前景较为清晰。这一点与其自身庞大的业务体系不无关系。即互联网巨头可通过将大模型集成到现有产品和服务中,比如百度文库文档助手、360AI搜索,生成式AI作为辅助功能,嵌入原有业务,来增加用户粘性并带动营收增长。但问题是,如果不能找到好的商业化模式,这些大模型该怎么办?周鸿祎分享了做AI应用的两大思路。他认为,第一,要找到明星场景;第二,一个模型未必能解决所有问题,需要多个模型联合工作。
“去年的时候大模型非常热,大家轮番发表自己大模型的各种功能、各种能力。大家当时有个误解,以为把大模型做出来了一个聊天机器人,用户就能用了,企业、政府就能提高生产力了。但是好像实际情况并不是这样。我自己总结反思了,大模型不是产品,而是能力。能力固然很重要,但能力一定要跟场景相结合,才能真正的产生价值,才能够真正的让用户使用。”周鸿祎表示。参考几年前AI的落地难,今天,必须有人站出来要为大模型的落地做探索了。
近期的国内AI领域,一个十分有看点的产品是周鸿祎发布的“AI助手”,它接入了360智脑,以及智谱AI、商汤科技、百川智能、字节跳动、百度、腾讯、科大讯飞、华为、MiniMax、零一万物、面壁智能、阿里云、幻方量化、好未来、月之暗面等国内主流厂商的大模型。按照周鸿祎的说法,单从性能角度说,今天中国各家大模型公司在单项能力上并不输GPT-4o,因此,将国内顶尖的AI模型聚集起来,在综合实力上完全能和GPT-4o掰手腕。在ISC.AI峰会现场,周鸿祎展示了混合大模型与GPT-4o的各方面PK结果,显示集各家所长的AI助手以80.4测试总分大幅超越GPT-4o的69.22分,且在11个能力维度上全面领先。
周鸿祎表示:“每个模型只干好一件事情,就可以通过模型联合协作,达到快速的响应,才能真正的产生价值,才能够真正的让用户使用。”这也是本次16家国内顶尖的大模型公司共同合作的原因。“我们合作以后会是什么样子?举个例子,我们会把大家的助手能力都集成在浏览器里来,我们提供了通用的AI助手的功能。”AI助手正式上线后,用户可从360安全卫士悬浮球、360安全浏览器和极速浏览器侧边栏、文本划词等入口快速启动该应用。
当然,16家大模型合作的最终目的是为了用户更好的使用产品。最强大模型联合打造的AI助手,和市面上其他助手体验上相比,有3个亮点:首先,多家模型可自选,哪家最强选哪家。尽管每家大模型宣称自己超过了GPT-4,甚至是GPT-4o,但是实际测下来和评比有不一样的感受,实际测试显示,大家各有所长;其次,效果可对比,交叉验证选最优解。用户问一个问题的时候,可以把2-3家的结果同时显示,并做交叉验证,获得最优结果;再次,意图识别,自动调度“360帮你选”。也就是当用户不知道怎么选的时候,可以让系统自动帮用户选。通过意图识别的专业模型,可以对用户问的问题进行意图判断,进行自动调度。举例来说,DeepSeek做数学和做代码的时候非常强,当用户想做数学或者代码的时候,会调用它。集齐了16家大模型厂家的能力、通过桌面和浏览器的便捷使用,AI大模型走出了产品入口和生态开放的一大步。
实现开放并不是产品完成式,实则是产品打磨的开端。AI需要不断增强和用户之间的粘性、让更多用户所使用,以进一步激活各家大模型的力量。怎么打磨呢?就是找场景。
“我的感觉,2024年大家应该在找应用、找场景、找产品的时候,是不是考虑一个思路,就是大模型如何能够解决用户日常的问题。但是,它会藏在很多场景的后面。所以2024年我觉得是‘场景之年’。”周鸿祎称。甚至他把场景提升到一个事关AI能否在中国变成“工业革命”的重要因素,有两个衡量指标:能不能走进百行千业,能不能走进千家万户。因此,360贡献安全卫士、浏览器、搜索、大模型手表等明星场景,和国产大模型合作打造AI助手,并率先开放桌面和浏览器两大核心产品入口,可服务超过10亿用户。而合适的场景,可以让每个大模型发挥都能发挥自身能力,一个明星场景可以提高10倍的体验。明星场景是让各家大模型发挥作用的第一步。周鸿祎表示:“找场景意味着未必要提供全能模型解决所有问题,而是让一个模型或者若干个模型联合工作,支撑好场景的功能。
比如如果只做文档分析、或者只做搜索,可能很多大模型的能力未必会需要全部都用上。”搜索是离用户最近的场景,作为受众广泛的高流量场景,经过过去20余年的教育和使用,让用户使用搜索的习惯已经根深蒂固,也就是说,谁能做好AI搜索,谁就有望动摇沉寂多年的传统搜索引擎市场。但是,搜索需要更强的产品力,AI搜索一定要比传统搜索更简单、速度更快、准确率更高、推理成本更低,才会获得大众的青睐。相比之下,老牌搜索引擎的用户基数、数据量较大,具有相对优势。基于多年来不断深挖垂直应用场景,老牌搜索引擎已经积累了丰富的用户、数据和经验,拥有了其它创业公司短时间内难以超越的护城河,同时也更容易打破早期AI搜索准确率不够的壁垒。此外,360将混合大模型的能力,应用在AI搜索中,带来了丝滑的用户体验。
通过360AI搜索,用户可以通过两种方式调用16家大模型的资源。一种是可直接在搜索对话框中输入问题和需求,由AI自动分析调用16个模型其中之一进行回答;另一种是用户也可以在回答前选择模型,并对比不同模型回答结果,进行答案筛选。中途还可以随时切换模型,系统会记住前面的上下文,让后面的模型继续完成对话,真正实现了“哪家最强用哪家” 。当技术成熟度提高,并把复杂的事情变的简单,AI搜索与用户之间将会产生粘性。更重要的是,当更多的用户愿意使用AI搜索,才能给AI反馈,以进一步激活各家大模型的力量。
过去20余年间,搜索引擎一直是引领着互联网产业的重要“发展引擎”之一。作为互联网基础设施级别的产品和技术,无论是过去亦或现在,将会有更多产品和应用在搜索引擎上创造可能;作为互联网新物种的缔造者,它始终都是进行时。
而如今,AI作为搜索引擎的最大变量,其所引领和创造的未来,也是进行时。