发现、追赶、拥抱,APUS李涛的AI“蒸馏法”

光子星球

撰文 | 王   潘  
    编辑 | 吴先之
    ChatGPT问世之后,全球化移动互联网企业 APUS创始人李涛发现“市场上有三类人,一类人在不断讲故事,一类人的内心极度不甘和落寞,还有一类人心态很好,闷头开始拼命做事。”
    李涛可能是最早接触到ChatGPT的中国企业家之一,4年前,OpenAI CEO SamAltman 就曾通过视频向他和张一鸣、沈南鹏等人展示过,用GPT-2操作DOTA2。
    
    去年12月,李涛接触到ChatGPT时,美国中小学生已经用这个新工具完成作业了,他开始感受到竞争所带来的压迫感。“我们可能比别人晚了5分钟,但这5分钟很重要,你会发现我们在意识、技术上以及很多地方晚了起码3到4个月以上。”
    显而易见的是,ChatGPT带来了生产资料变革。
    由于传统IT产业都是手工业时代,每一个程序员得手工编写代码,眼下人工智能正在让IT产业则进入到自动化时代——GPT4已经能够解决不少编程问题。
    为了让APUS的员工尽早适应人工智能,公司开启了一系列基于大模型的业务改革。今年以来APUS程序员、设计师以及生产一线的员工都开始用人工智能来提升自己的生产效率,并提前2个月开始用人工智能改造现有产品。
    光子星球了解到,为了适配ChatGPT所拉开的人工智能时代,今年APUS加薪的标准皆与使用人工智能工具挂钩,并形成了一套具有可操作性的制度:如果用人工智能能够提升生产效率,则对应加薪比例,例如提升30%效率,加薪10%;提升50%以上,加薪20%-30%。
    或许是有切身之感,李涛对人工智能的未来,有了全新的思考。
    生长与创业
    李涛关注到ChatGPT,或者说APUS拥抱人工智能并不是一件偶然的事情。
    APUS由内而外地迅速开启新一轮战略变革,有两个动因。作为企业管理者,李涛享受不断创业的过程,而APUS的发展过程对于外部反馈始终保持着敏感。另一个动因得益于此前转向全球化,对于变动中的外部环境有更强的感知能力。
    谈及创业,李涛认为首先得保持平和的心态,其次要顺势而为,最后是享受创业过程。
    
    “你可以发现,中国大多以互联网为代表的数字企业,背后都有一位连续创业者,他们把公司做上市以后还在坚持不懈地往前,为什么?因为上市对他来说只是一个节点,以上市为契机,还要做很多事情。”
    2014年,APUS是国内最早的一批出海企业之一。当年7月2日,第一款产品APUS Launcher上线,到如今,APUS系统及其产业品群全球总用户数超24亿人,覆盖200多个国家和地区。
    出海让APUS驶入增长快车道的同时,也和如今大部分出海企业一样,面对着来自全球各地的封杀与打压。于是在2019年,APUS调整发展战略,这家昔日出海的先锋,开始把自己转变为“全球化”企业。
    “(我们)不把自己定义为一家出海的中国公司,而是当成一个国际化的公司。中国与美国,只是我们选择的一个市场,以这种心态来面对全球市场与新技术,使得APUS在感知和思维模型变得国际化。”
    ChatGPT的出现让APUS看到人工智能将全方位改变业态。李涛曾现场展示高清设计,按照APUS过去的AI模型生产,起码是需要两天时间,而基于ChatGPT的AIGC能力,只需要一秒钟。
    事实上,即便如今AIGC已经取得了长足发展,但不可否认的是,大部分AIGC产品其实都不算大模型,而是自建的中等模型。所谓大模型,指的是算力与数据量大,从中跑出来的模型的包容性极强,适应性好,涉及面广。
    大模型相当于人类知识的集合。
    众所周知,演绎与归纳是推动人类智识进步的两大方法论,而人工智能发展的底层逻辑其实是一部缩略版的人类智识发展史。
    传统搜索引擎其实是归纳法的产物。其工作环节包括关键词输入、爬取数据以及根据搜索需求反馈结果。然而归纳法本质上是整理、反馈已有知识,没有创造新的价值。相当于一个人能够熟练背诵全唐诗,却根本不会创作一首七律。
    业内之所以认为ChatGPT将会是下一代搜索引擎,是因为ChatGPT帮助人类重新利用现有知识生成一个在历史上从来未出现过的结果。另一方面,其生成的结果具有唯一性。过去,上述两件事本质上是藉由人类智慧完成,现在机器也有了可能。
    
    李涛认为,基于人工智能,ChatGPT已经展现出下一代操作系统的苗头。“如果说第一个时代操作引擎是Windows和Linux,第二个时代的操作引擎就是安卓和iOS,下个时代的操作引擎,就是人工智能。”
    正因如此,APUS才会将人工智能全盘引入到生产过程中。
    人工智能四步走
    此前,数据、算力、算法被视为人工智能的“三大件”,随着大模型出现,“场景”跃升为最重要的一环。
    互联网奔腾的二十多年中,中国并不缺乏场景与数据,倒是算力与算法上存在不少短板,尤其是国内开源环境相对滞后,导致算法分散、算力不足。
    国内科技企业将竞争视为头等大事,大多成了拥“算法”自重的“诸侯”,客观上造成国内算法处于极度分散的状态,因此无法形成合力。只有代码的公开才可以让大家不断迭代,OpenAI的成功已经证明了,开放平台能够聚合更多的人维护、升级代码,从而提升数据和模型的能力。
    
    另一方面,算力产业依然面临需求碎片化。例如国产基础软件生态和配套芯片不强、传输能力不足、无效算力增多、人才紧缺、难互通协同等诸多挑战,加之当下正在经历从CPU到GPU的转型过程中,国内算力处于不足的状态之中。
    摆在国内企业面前的有两条可操作路径,一条是以AIGC为标的中等模型,能够支撑1款到10款不同的产品和软件,这样既能保证商业化的运作,又维持足够大的用户量,还能训练自己的模型。
    李涛告诉光子星球,解决上述问题,APUS找到了一条被其称为“蒸馏”的方法来训练APUS的模型,并在此基础上封装成无数的精炼模型来提供服务,以ChatGPT为代表的人工智能是人工智能的起点。简单来说就是反向使用GPT这样的大模型,用蒸馏法来训练自己的模型。
    此外,针对行业大多聚焦于大模型,APUS将精力放在了中小模型之上,例如AI作画、AI谱曲、AI编程等等。相较于大模型,中小模型更容易寻找落地场景,也能够更高效地完成针对性的训练,更何况,是封装自ChatGPT。
    由于大模型和中小模型有着泾渭分明的界限,因此将大模型封装为中小模型,而中小模型则无法逆向为大模型,所以APUS基于ChatGPT这种大模型去开发、融合中小模型的路径具有现实意义。
    其实,中小模型间的界限主要体现在参数和场景之中。相较而言,中模型最复杂的,一般情况下中模型通常为自建的独立模型,比如说旷世、商汤,大多偏重归纳法,而轻于演绎法。未来,留给独立小模型可发挥的空间有限,一般都是用大模型或中模型封装成小模型。
    在李涛看来,大模型的首要目标并非商业化,而是制定行业标准,类似于安卓与iOS之争。对于大部分企业而言,只需要关心小模型和中模型即可。“毕竟未来这个世界最有价值的东西就两个,一个是操作系统,一个是生态就是场景,其他的东西都是过眼云烟。”
    总而言之,ChatGPT敲醒了大家,开启了一个新起点,眼下应该考虑如何快速的追赶,于是需要借他人数据来为我所用,这便是为何APUS会用“蒸馏法”来训练自己的模型的核心原因。
    奇点来临
    有趣的是,虽然APUS拥抱ChatGPT,但李涛并不是人工智能的激进派,他认为目前应该引入一部分人工干预。长期来看,用人工智能的模型输出结果的效率比人的效率更高,人工干预的效率已经远远低于AI模型训练,人工主要在关键算法上去干预。
    APUS给自己定了两个“KPI”,除了此前提到的今年全面转型人工智能外,另一个是业绩增长200%以上。李涛对于业绩增长的期待并非信口开河,“人工智能意味着可以预测每一秒钟,在全世界任何一个地方花了一块钱,能产生怎样的收益,现在我们已经开始提升内部系统的生产效率了。”
    眼下,人工智能对生产资料的重构正引发新一轮工业革命,在李涛看来行业处于变革奇点,将按照四个步骤展开,分别是内部提效工具、现有产品进化、AI+场景重塑、构建新产业引擎。
    2023年,直播间里的细微变化,似乎回应了上述观点。
    薇娅、李佳琦们退隐,接续他们的腰部主播似乎也无法完全接班,在这段时间里,数字人开始一点点填补真空地带。尽管当下数字人的表现并不如人意,可是随着人工智能发展,尤其是大中小模型加速融合,且不说完全代替人,至少数字人能代替大部分真人,甚至直播间也会被元宇宙替代,从而完全改变现有直播电商逻辑。
    当下有一种观点认为,人工智能将完全“代替”人类的各项能力,这种观点其实是一种静态思考,忽视了人和AI一样,需要持续学习才能不断完善。
    “站在人工智能这条赛道,比拼的是谁把人工智能用得更彻底,谁的生产效率最高,谁就能站在潮头,而那些被动接受者则会慢慢会被淘汰。”