谷歌惨遭泄密!内部文件曝出AI最大赢家


    “谷歌不会是AI竞争中的赢家,OpenAI也不是!”
    当地时间周四,一份披露了这样信息的谷歌内部文件在全网疯传,引起热烈的讨论。
    俗话说,福无双至,祸不单行。要问硅谷巨头们这段时间谁最头疼,那绝对非谷歌莫属。
    
    先不说自家的AI大模型巴德(Bard)姗姗来迟,差点没赶上这波AI大潮。近日,“AI教父”杰弗里·辛顿(Geoffrey Hinton)宣布自己从谷歌离职,他对自己所从事的事业感到“深深地后悔”。并四处奔走相告“AI太可怕!人工智能很有可能演变成一场灾难”。这让谷歌一边失去了“图灵奖”大佬的技术和名望支撑,另一边又陷入“AI威胁论”中不能自拔。
    
    就在这份文件曝出的当天,谷歌、微软、OpenAI和Anthropic的CEO与美国副总统卡玛拉·哈里斯(Kamala Harris)和高级政府官员会面,讨论关键的AI问题。也就是说这边正开着会,谷歌那边的内部文件就遭到了泄露,这怎么能不让谷歌一个头两个大。
    据悉,这份文件来自于谷歌的一名工程师。他在文件中直言不讳地说,“我们没有护城河,OpenAI 也没有”。他认为在这场空前激烈的AI竞争中,谷歌正在失去先前作为AI领军人物的地位。但这并不意味着“风头正劲”的OpenAI会是最后赢家,因为他们都还没意识到一股强大的第三方力量正在崛起——AI开源社区。
    
    根本没有所谓的“护城河”
    谷歌发愁不难理解。一个是愁这样的言论会不会影响公司形象,影响股价;另外一个是意识到此言非虚。AI开源社区比他们预想的发展速度要快很多。
    自诞生之日开始,OpenAI就宣布GPT不会开源,你如果想用上这项技术,就来跟我合作。可谁也没想到,“二五仔”Meta狠狠的助攻了一把。
    Meta开发的LLaMA(大羊驼)大模型,还没捂热乎就因为泄露而走上了开源的道路。这下可不要紧,直接引爆了开源社区,让那些被高昂训练成本筑成的“护城河”拒之门外的各路开发者,纷纷大展拳脚。Meta真不愧是AI界的神兽……
    其中斯坦福最先发布了一个由LLaMA 7B微调的模型Alpaca,训练3小时,性能就比肩GPT-3.5。之后经过指令跟随微调的开源大语言模型如雨后春笋一般大量涌现,如在树莓派 4B 上运行 LLaMA 模型、在笔记本上对 LLaMA 指令微调、在 MacBook 上跑 LLaMA 等。大模型的开发门槛已经从一个主要研究机构下降到一个人、一个晚上和一台强大的笔记本电脑。
    
    虽然LLaMA本身存在一定缺陷,但是开源之后快速的迭代速度能逐渐补完模型。
    最近,由UC伯克利主导的LMSYS Org发布了大语言模型排行榜,来比较热门的大语言模型实力究竟如何。
    其中UC伯克利自己推出的Vicuna-13B拥有130 亿参数,以 1169 分稳居第一。同样 130 亿参数,与Vicuna师出同门的Koala(考拉)位列第二,LAION 的 Open Assistant 排在第三。清华推出的 ChatGLM只有60 亿参数,但依然冲进了前五,只比 130 亿参数的 Alpaca 落后了 23 分。而Meta 原版的 LLaMa 只排到了第八(倒数第二)。
    
    这个排行榜非常有力地佐证了文件中提到的,开源开发者可以用100美元和130亿参数,去做谷歌和OpenAI用1000万美元和540亿参数都做不到的事情。甚至于做到这些不需要几个月时间,几周就够了。
    “大模型正在拖累谷歌,从长远来看,最好的模型是那些可以快速迭代的模型。”谷歌工程师如是说道。
    开源社区可怕的发展和迭代速度,让这些巨头引以为傲的“坚不可摧的护城河”显得那么可笑……
    领先优势不再,谷歌为哪般?
    谷歌布局AI不可谓不早,成果更是卓著。2014年谷歌收购人工智能公司DeepMind,2016年谷歌宣布从“Mobile First” 转向“ AI First”战略,AI逐步成为谷歌战略版图中最重要的一块。同年DeepMind发布了轰动一时的AlphaGo,一度成为未来AI的代名词。
    但这位“先驱者”却在新一波AI浪潮里被抢占先机,这难免让人有些沉不住气。
    
    谷歌内部的权力斗争、监管机构的监督、来自员工的施压都让现任CEO皮查伊难敌其扰。而错失AI先机,跟谷歌被内忧外患包围,和高层的谨小慎微不无关系。这次的泄密事件,不亚于响彻他们头顶的一声炸雷。
    虽然谷歌发言人称泄露的文件并不是公司的官方战略文件,但是其中讨论的问题却是谷歌不得不面临的挑战。
    面对来势汹汹的开源大模型,本就不怎么有优势的谷歌该做些什么?
    谋求瘦身。谷歌正在规划其自身AI项目的体积和机构,据称谷歌已经削减了其内部孵化器 Area 120 中绝大部分,只留下了三个。
    扩大测试基数。昨天晚些时候,微软宣布彻底开放Bingchat给公众使用,取消候补名单机制。并承诺后续蒋开放多模态能力和插件调用功能。紧接着,谷歌也坐不住了。今天就宣布将 Trusted Tester  测试计划的用户规模扩大10倍,让更多的用户参与测试。
    而在即将举行的2023 I/O大会上,谷歌计划将生成式 AI 聊天机器人 Bard 以小部件的形式,引入到 Pixel 系列手机中,这样用户就不需要通过 Chrome 等浏览器就能访问 Bard。这个 Bard 小部件是 Pixel 8 系列和即将推出的 Pixel Tablet 平板的独占功能。
    
    这种种动作都似乎表明了谷歌在寻求更有效的方法,在竞争中保持战斗力。和开源社区直面竞争绝对是亏本买卖,现在能做的就是向他们学习。善加利用低秩矩阵微调方法(LoRA),密切关注开源社区的动向,避免在后面的开发过程中重蹈覆辙……
    “当免费的、不受限制的替代品有着同等质量时,人们不会为受限制的产品付费。”这是这场AI竞赛里,每个人都该牢记的隐形规则。