大模型的大厂之战：八仙过海，各显神通

2024.09.28 独角兽挖掘机

    诸神之战，谁能笑到最后？
    手工劳动/挖哥手工编辑 /角叔出品/独角兽挖掘机
    如果哪个大厂还没做大模型，应该都不好意思跟别人打招呼了。
    年初ChatGPT横空出世，引爆了国内大模型的热情，各路资金蜂拥而入。其中以百度、阿里、华为、京东等为代表的互联网大厂更是重金押注、无一缺席。
    “我最初以为AI是互联网10年不遇的机会，但现在，我觉得这是几百年不遇的，类似发明电的工业革命一样的机遇。”向来低调的马化腾也给了AI极高的评价。《中国人工智能大模型地图研究报告》显示，我国10亿参数规模以上的大模型已发布79个，“百模大战”一触即发。
    世人皆知大模型香，但也知世上不需要这么多大模型。
    在这场未来科技高地的攀岩中，最终能登顶，笑到最后的必然是寥寥无几，而大厂凭借着先天的资本、算力、大数据等优势，无疑是百模大战中的“种子队”。
    本文盘点百度、华为、阿里、腾讯、京东、美团、字节、科大讯飞八家大厂的大模型特点，未来翘楚，应该有他们的一席之地。
    01百度文心一言：最硬核
    国内大厂里，百度是最先交大模型作业的。3月16日，百度发布了生成式AI产品文心一言，发布首日就有超60万人申请测试。百度能成为第一个吃螃蟹的大厂，有赖于近些年在人工智能领域的深耕和积累。
    早在2019年，百度就推出了知识增强的语义理解框架文心大模型，并广泛应用于阅读理解、情感分析等领域。人工智能已成为这家以搜索起家的科技企业的新标签。
    在大模型之前，百度在人工智能领域就在自动驾驶、智能云等多个领域进行了前瞻布局，拥有先发优势。

    百度创始人李彦宏更是亲自下场，成为大模型的坚强拥趸：“科技创新驱动了大的增长。沿着这个思路，如果让我来判断第四次科技革命的标志，我认为是深度学习算法。”
    当然，第一个关注度最高，被吐槽也不少，比如，文心一言刚上线，作为新生，在面对车水马龙、夫妻肺片这些内涵词时，理解能力还停留在字面意思，像车水马龙出现了“汽车+龙”的元素叠加图片。
    不过在用户的反馈下，文心一言很快就学习到正确的理解和绘制方式，能绘制出车马成群结队、繁华热闹的“车水马龙”街景。
    在IDC最新发布的《AI大模型技术能力评估报告，2023》中，百度文心大模型拿下12项指标的7个满分，综合评分第一，尤其是算法模型、通用能力等基础技术领跑全行业，算法模型获得唯一一个满分。
    如果说，大模型对其他大厂来说多是副业，对All in人工智能的百度来说，是一号工程，这也让它拥有了最硬核的实力。
    02华为盘古：最被寄予厚望
    作为在国际市场上最能扛的科技企业，华为在5g的强大让美国不得不穷尽各种手段来打压，在AI这个国际角逐的新战场，华为理所当然也被寄予厚望。
    7月7日，在华为开发者大会2023上，华为云正式发布盘古大模型3.0。盘古大模型3.0是一个完全面向行业提供服务，以行业需求为基础设计的大模型体系，包括5+N+X三层架构。
    华为盘古大模型早在2020年就启动研发，华为云CEO张平安表示希望用盘古大模型帮助各行各业，例如在金融、政务、矿山、气象等行业，在产品研发、生产供应链、市场营销以及数字运作领域，让盘古大模型为他们赋能。
    从华为的策略来看，虽然国内外C端的大模型声量大，但华为还是做自己擅长的B端市场，并且已经进入实操阶段。7月18日，华为联合山东能源集团举行发布会，宣布华为盘古大模型在矿山领域实现首次商用。
    从通信网络设备到5G手机、智能驾驶，华为都展现了其强大的科技底蕴和技术实力，在AI领域，华为自然也承担着更高的期望。
    03京东灵犀：最懂产业
    7月13日，在2023京东全球科技探索者大会暨京东云峰会上，京东正式推出灵犀大模型。
    与其他通用大模型相比，京东灵犀可谓是“从产业中来，到服务产业中去”，融合了70%通用数据与30%数智供应链原生数据，具有“更高产业属性、更强泛化能力、更多安全保障”的优势，深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景，解决真实产业问题。
    对于大模型价值的思考，京东也提出了自己的独到见解：大模型的价值=算法×算力×数据×产业厚度的平方。

    京东CEO许冉认为，前三个指标固然重要，但技术在产业场景落地应用，创造实际价值才是关键。当产业效率和产业的边界拓展得到质的提升以后，大模型才有了更重要的实际价值和意义，这将不亚于又一次工业革命。
    从京东的发展史来看，产业早已融入京东的基因和血脉中，从产业场景切入做大模型，做的也是京东非常擅长的领域，训练出的大模型天然具备“产业基因”。
    04阿里通义千问：最强算力
    4月11日，阿里云宣布推出大语言模型“通义千问”，并表示包括天猫、钉钉、高德地图、淘宝、优酷、盒马等阿里巴巴所有产品，未来都将接入“通义千问”大模型全面改造。
    阿里云总裁张勇谈到阿里云战略的核心，表示未来要做好两件事情——让算力更普惠、让AI更普及。其中的算力是阿里做大模型的核心竞争力。
    大模型背后的海量数据，需要有强大的算力作为支持。某种程度上，大模型之争说到底也是云服务之争、是算力之争。
    在数字基础设施，阿里云拥有国内最强的智能算力储备，阿里云的智算集群可支持最大十万卡GPU规模，承载多个万亿参数大模型同时在线训练，为大规模AI集群提供无拥塞通讯的自研RDMA网络架构和低成本高可靠的高性能存储CPFS。
    在国际权威机构Gartner榜单中，阿里云是亚洲第一、全球第三的云计算服务商。在2021年底Gartner对云厂商整体能力评估中，阿里云IaaS基础设施能力拿下全球第一，在计算、存储、网络、安全四项核心评比中均斩获最高分。
    05腾讯混元助手：最擅社交
    作为初代互联网BAT三巨头之一，腾讯在大模型领域上表现得比较内敛。
    去年 4 月，腾讯首次对外披露了混元 AI 大模型的研发进展，这是一个包含 CV（计算机视觉）、NLP（自然语言处理）、多模态内容理解、文案生成、文生视频等方向的超大规模 AI 智能模型。
    今年 2 月底，在 ChatGPT热潮下，腾讯也被曝出成立了混元助手项目组，这个项目组将联合腾讯内部多方团队构建大参数语言模型。
    千呼万唤始出来，6月19日，在行业大模型及智能应用技术峰会上，腾讯第一次公布了腾讯云行业大模型的研发进展，围绕B端需求，腾讯反复强调大模型是为“具体场景设计的具体应用”。
    没有哪家大厂比腾讯更懂社交，凭借着庞大的用户基数和强大的技术实力，腾讯在大语言模型AI的布局，尤其是类ChatGPT聊天机器人，有着别人无法比拟的优势。
    对于腾讯的聊天机器人是集成到QQ、微信，还是通过腾讯云向B端用户服务，腾讯云与智慧产业事业群CEO汤道生表示：“都会有。”
    06美团光年之外：最命运多舛
    光年之外由美团联合创始人王慧文在今年2月创立，彼时王慧文已经处于“退休”状态，大模型让他重燃了创业激情。肩负起打造“中国OpenAI”的使命。
    在短短两个月时间里，光年之外吸引了众多人工智能领域顶级专家和创业者的加入，完成了以产品和技术人才为主的团队搭建。
    王慧文自带的创业成功者光环，还有王兴以个人身份投资的加持，光年之外从成立第一天起，就站在了聚光灯下，成为大模型赛道里的初创企业的明星。然而，出师未捷身先伤，雄心勃勃的王慧文出现个人健康原因，不得不离岗就医。
    群龙无首之时，王兴出手了。6月29日，美团的一纸公告宣布完成光年之外境内外主体100%股权的收购，收购价约为20.65亿人民币。
    从这笔收购来看，既帮助了兄弟，又增强了美团的大模型实力。
    王兴与王慧文是清华上下铺的室友，从携手创办校内网到美团，两人从同窗到创业伙伴，成就了彼此。另外，美团自身也有做大模型的需求，通过这次收购，美团获得领先的AGI技术及人才，可以加强其于快速增长的人工智能行业中的竞争力。
    虽然有些命运多舛，但最后的归宿还是很不错。
    07科大讯飞讯飞星火：最有学问
    4月24日，科大讯飞星火认知大模型官网正式上线。
    作为AI语音龙头，讯飞星火认知大模型围绕“知识问答、代码编程、数理推算、创意联想、语言翻译”等场景布局。
    上线一个月后，讯飞星火认知大模型各项能力持续提升，且在综合能力上实现三大升级：开放式知识问答取得突破，多轮对话、逻辑和数学能力再升级。拥有如此强大的学习能力，也让讯飞星火的“学问”越来越大。
    在应用落地上，科大讯飞重点是推动星火认知在教育、医疗、工业、办公等领域落地。比如，在教育领域，科大讯飞已经在学习机上尝到甜头，在星火大模型与教育垂直场景的深度融合下，有望广泛应用于教师备授课、作文批阅、学生语言学习、心理健康监测等常见场景。
    凭借着AI语音和知识问答上的优势，讯飞星火在定位上，可能是与ChatGPT最接近的大模型。
    08字节火山方舟：最低调
    当其他大厂一把手挂帅亲自站台，对大模型不吝赞美之词时，已与BAT平起平坐的字节却相对低调得多。

    直到6月28日，字节跳动公布了大模型业务最新进展，在火山引擎主办、英伟达合作举办的“V-Tech体验创新科技峰会”上，火山引擎发布大模型服务平台“火山方舟”，面向企业提供模型精调、评测、推理等全方位的平台服务。
    集成多个大模型，供客户直接对比，火山方舟避开烽火连天的大模型大战，选择做大模型服务平台，以卖水者身份杀入大模型赛道。
    选择这条路，字节也有自己的考量，与其他大厂布局多年对比，字节虽然在算力、算法等AI基础设置上不逊色，但还是慢了一拍，字节语言大模型团队今年初才成立。
    在没有先发优势的情况下，又不想缺席大模型盛宴，选择为大模型客户提供算力AI基础设施，帮助做好大模型开发，这样的另辟蹊径也不失为理智的选择。（完）