起大早赶了个晚集?百度“文心一言”背水一战
3月16日中午,百度宣发类 ChatGPT 聊天机器人产品文心一言。
“文心一言”是是百度的预训练、生成式大语言模型,英文名 ERNIE Bot,主要应用包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等方面。
在国内调用 ChatGPT 的 API 还有风险,且中文使用感受是明显不如英文场景。作为扎根于中国市场的大语言模型,大家异常期待文心一言。
但是,百度打磨十年的“文心一言”显然属于起大早赶了个晚集。
李彦宏亲自领兵,五大使用场景
百度李彦宏介绍,早在2010年百度就开始布局语言生态,在2019年3月的时候推出了用于知识增强的语义理解框架“文心”,从此开启了大模型深度学习。
2023年春节过后,文心一言“项目组”悄然出现,它由李彦宏亲自过问、CTO王海峰挂帅,两位高层每晚都会和文心一言项目组开会。百度CTO王海峰解释称,文心一言,其名包含了“文心雕龙,精心打磨”的希冀。
李彦宏配合 demo 视频展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。
文学创作展示,总结《三体》核心内容——
商业文案创作展示,完成给公司起名、写Slogan、写新闻稿的创作任务——
数理推算展示,解鸡兔同笼问题——
昨日发布的 GPT-4 使用中,有人反馈中文使用感受是明显不如英文场景,作为扎根于中国市场的大语言模型,文心一言展示了具备中文领域最先进的自然语言处理能力。比如,让文心一言正确解释成语「洛阳纸贵」的含义、对应的经济学理论等——
从现场展示来看,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。
没那么完美,对标ChatGPT门槛高
李彦宏认为 IT 技术栈到了AI时代有四层:从下到上依次是芯片层、框架层、模型层和应用层。刚发布的文心一言处于模型层,以后AI时代的应用会基于这些预训练大模型进行开发。
文心一言赶在 GPT-4 晚一天发布,能看到赶工痕迹明显——不是实时演示、没有技术拆解、无直接可用产品、未开放公测,这样的产品很难说是可以服务大众的。
虽然李彦宏现场展示了文心一言生成文本、图片、音频和视频的多模态能力,是提前准备好的视频,并不能展示其反应能力和真实水平。
发布会中文心一言生成四川方言显然是个惊喜,但没有展示英文能力,而且也没有展示编程能力,李彦宏承认语料集输入不够。
此外,还有令人遗憾的一点,此次发布没有直接产品可以用,需要申请邀请码,没有广大用户参与构建生态。
李彦宏和首席技术官王海峰均表示,“文心一言还不完美,它会在用户的使用参与过程中加速优化,GPT-4 也是无数大众调教和互动反馈升级至今的智慧结晶。”李特别提及,“文心一言不是中美对抗的工具,这类大语言模型还远未到发展完善阶段,进步空间很大。
据王海峰介绍,今日起首批用户即可通过邀请测试码,在文心一言官网体验产品,同时,百度智能云将面向企业客户开放文心一言API接口调用服务,3月16日起正式开放预约。
来到试用界面,可以看到受邀仅面向企业用户,只能提交审核才能试用。
另有猜测,邀测面向企业用户是为了未来走 toB 商业化道路。产品还没推出,公司内部的场景方、变现方看上去已经跃跃欲试。他们想要快速将其转化为可产生收入的商业产品。据媒体报道,已有650多家企业宣布接入文心一言。
股价应声大跌
资本市场似乎对这次发布并不买单。
百度发布文心一言当日,百度股价一度下跌10%至120.1港元。截至发稿,跌幅收窄至7.34%,报123.8港元
发布会正在进行的时候,港股百度集团盘中跌幅一度超过10%,直播弹幕调侃李彦宏“下台看到股价,悔恨办这场发布会”。
Talk is cheap,show me the product
在百度发布会前一天的凌晨,Open AI发布的 GPT-4 在识图能力、文字输入限制、回答准确性以及能生成创意文本、歌词等方面都有出色表现,这给百度带来了很大压力。
在国内调用 ChatGPT 的 API 还有风险,所以大家异常期待文心一言,以及它带来的更出色的中文能力,但是,短期内拿出过硬且惊艳的产品并不现实。
中美的差距,不是百度一己之罪也。从全球格局来看,做大模型的三个要素是算力、算法和数据。在算力端,手握重金、掌握头部科技的美国大公司有显著优势。
作为国内第一个面向大众群体的大语言模型迎面冲击全球新的 AI 格局,文心一言尽管有不足,但应该被鼓励,再给它一些时间——
Talk is cheap,show me the product.