起大早赶了个晚集？百度“文心一言”背水一战

2024.09.23

    3月16日中午，百度宣发类 ChatGPT 聊天机器人产品文心一言。
    “文心一言”是是百度的预训练、生成式大语言模型，英文名 ERNIE Bot，主要应用包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等方面。
    在国内调用 ChatGPT 的 API 还有风险，且中文使用感受是明显不如英文场景。作为扎根于中国市场的大语言模型，大家异常期待文心一言。
    但是，百度打磨十年的“文心一言”显然属于起大早赶了个晚集。

李彦宏亲自领兵，五大使用场景

    百度李彦宏介绍，早在2010年百度就开始布局语言生态，在2019年3月的时候推出了用于知识增强的语义理解框架“文心”，从此开启了大模型深度学习。
    2023年春节过后，文心一言“项目组”悄然出现，它由李彦宏亲自过问、CTO王海峰挂帅，两位高层每晚都会和文心一言项目组开会。百度CTO王海峰解释称，文心一言，其名包含了“文心雕龙，精心打磨”的希冀。
    李彦宏配合 demo 视频展示了文心一言在五个使用场景的表现，包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。
    文学创作展示，总结《三体》核心内容——
    商业文案创作展示，完成给公司起名、写Slogan、写新闻稿的创作任务——
    数理推算展示，解鸡兔同笼问题——
    昨日发布的 GPT－4 使用中，有人反馈中文使用感受是明显不如英文场景，作为扎根于中国市场的大语言模型，文心一言展示了具备中文领域最先进的自然语言处理能力。比如，让文心一言正确解释成语「洛阳纸贵」的含义、对应的经济学理论等——
    从现场展示来看，文心一言某种程度上具有了对人类意图的理解能力，回答的准确性、逻辑性、流畅性都逐渐接近人类水平。

没那么完美，对标ChatGPT门槛高

    李彦宏认为 IT 技术栈到了AI时代有四层：从下到上依次是芯片层、框架层、模型层和应用层。刚发布的文心一言处于模型层，以后AI时代的应用会基于这些预训练大模型进行开发。
    文心一言赶在 GPT－4 晚一天发布，能看到赶工痕迹明显——不是实时演示、没有技术拆解、无直接可用产品、未开放公测，这样的产品很难说是可以服务大众的。
    虽然李彦宏现场展示了文心一言生成文本、图片、音频和视频的多模态能力，是提前准备好的视频，并不能展示其反应能力和真实水平。
    发布会中文心一言生成四川方言显然是个惊喜，但没有展示英文能力，而且也没有展示编程能力，李彦宏承认语料集输入不够。
    此外，还有令人遗憾的一点，此次发布没有直接产品可以用，需要申请邀请码，没有广大用户参与构建生态。
    李彦宏和首席技术官王海峰均表示，“文心一言还不完美，它会在用户的使用参与过程中加速优化，GPT－4 也是无数大众调教和互动反馈升级至今的智慧结晶。”李特别提及，“文心一言不是中美对抗的工具，这类大语言模型还远未到发展完善阶段，进步空间很大。
    据王海峰介绍，今日起首批用户即可通过邀请测试码，在文心一言官网体验产品，同时，百度智能云将面向企业客户开放文心一言API接口调用服务，3月16日起正式开放预约。
    来到试用界面，可以看到受邀仅面向企业用户，只能提交审核才能试用。
    另有猜测，邀测面向企业用户是为了未来走 toB 商业化道路。产品还没推出，公司内部的场景方、变现方看上去已经跃跃欲试。他们想要快速将其转化为可产生收入的商业产品。据媒体报道，已有650多家企业宣布接入文心一言。

股价应声大跌

    资本市场似乎对这次发布并不买单。
    百度发布文心一言当日，百度股价一度下跌10％至120．1港元。截至发稿，跌幅收窄至7．34％，报123．8港元
    发布会正在进行的时候，港股百度集团盘中跌幅一度超过10％，直播弹幕调侃李彦宏“下台看到股价，悔恨办这场发布会”。

Talk is cheap，show me the product

    在百度发布会前一天的凌晨，Open AI发布的 GPT－4 在识图能力、文字输入限制、回答准确性以及能生成创意文本、歌词等方面都有出色表现，这给百度带来了很大压力。
    在国内调用 ChatGPT 的 API 还有风险，所以大家异常期待文心一言，以及它带来的更出色的中文能力，但是，短期内拿出过硬且惊艳的产品并不现实。
    中美的差距，不是百度一己之罪也。从全球格局来看，做大模型的三个要素是算力、算法和数据。在算力端，手握重金、掌握头部科技的美国大公司有显著优势。
    作为国内第一个面向大众群体的大语言模型迎面冲击全球新的 AI 格局，文心一言尽管有不足，但应该被鼓励，再给它一些时间——
    Talk is cheap，show me the product．