阿里、商汤等争抢AI大模型市场!接下来还有这场重磅发布......
昨日,商汤科技刚刚发布“日日新”大模型,今天又一业内重磅嘉宾来袭——阿里。
今日消息,阿里所有产品未来将接入“通义千问” AI大模型,向所有企业开放!
“我们将开放通义千问的能力,帮助每家企业打造自己的专属大模型。”阿里云智能CTO周靖人在今日的阿里云峰会上宣布。
据悉,阿里所有产品未来将接入通义千问进行全面改造,钉钉、天猫精灵率先接入测试,将在评估认证后正式发布新功能。
值得注意的是,在ChatGPT发布以后,AI再一次被推向风口浪尖,国内互联网科技企业先后入局,百度,华为,科大讯飞,商汤,阿里纷纷发布自己的大模型产品。
就如张勇所说的,在智能化时代,所有公司都在同一起跑线上。所有的行业、软件以及服务都值得基于新型的人工智能技术‘重做一遍’,这不仅会带来创新性的客户体验,同时也会让我们的生产、工作、生活范式发生变化。
为此,本文将为大家整理了自ChatGPT发布以来,国内相关知名企业发布AI大模型情况。
阿里“通义千问” AI大模型,向所有企业开放
据悉,阿里所有产品未来将接入通义千问进行全面改造,钉钉、天猫精灵率先接入测试,将在评估认证后正式发布新功能。
根据钉钉当天预告的Demo演示,接入通义千问之后的钉钉可实现近10项新AI功能,提升办公效率;根据天猫精灵官方预告的演示Demo,接入通义千问后,新天猫精灵变得更拟人更聪明,知识、情感、个性、记忆能力得到提升;此外,通义千问还将陆续嵌入阿里电商、搜索、导航、文娱等场景。
“未来所有软件都值得接入大模型升级改造,我们将开放通义千问的能力,为每一家企业打造自己的专属GPT,欢迎所有人用阿里云开发自己的大模型。”周靖人表示,阿里云将提供完备的算力和大模型基础设施,让包括创业公司在内的所有企业和机构更好地实现创新,让中国整体的 AI 能力有全方位的提升。
周靖人介绍,未来每一个企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。
发布会当天,阿里云宣布将与OPPO安第斯智能云联合打造OPPO大模型基础设施,基于通义千问完成大模型的持续学习、精调及前端提示工程,未来建设服务于其海量终端用户的AI服务。同时,吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技(23.770, 1.33, 5.93%)等多家企业表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。
商汤版“ChatGPT”
随着ChatGPT热潮在全球范围的高涨,国内互联网科技大厂也纷纷官宣自己的大模型产品。
4月10日,商汤科技宣布推出商汤自研的大模型“日日新SenseNova”,并基于这一模型推出了一系列生成式AI应用,从文本聊天到AI绘画,功能相当全面。
具体来看,在基于SenseNova的模型上,商汤推出了秒画、如影、琼宇、格物四大平台,分别对应自然语言聊天、文本生成图片、AI数字人以及空间3D大模型生成。
同时,商汤还宣布,推出商汤自研中文语言大模型应用平台“商量 SenseChat”。据介绍,这是一个1800亿参数的中文大语言模型,若仅按此参数规模来看,SenseChat的参数量已超越GPT-3.5的参数量。
此外,据笔者了解,除了大模型,商汤还布局了算力赛道,商汤历时五年建设了业界领先的AI大装置,大装置上总共有27000块的GPU芯片卡,可以输出5.0exaFLOPS的总算力,是亚洲目前最大的智能计算平台之一。
百度“文心一言”
3月16日,百度正式发布文心一言。
发布会当天,李彦宏表示,“文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个,我自己测试感觉还是有很多不完美的地方。”
从百度的发布来看,文心一言有五大能力:文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成,因此,李彦宏的演示也聚焦于这五个方面。
为什么不完美还要发布?李彦宏说,因为市场有需求,短短一个月,有超过650家合作伙伴宣布加入文心一言生态,大家都希望能早一点用上最新最先进的大语言模型,一旦有了真实的人类反馈,文心一言的进步速度会非常快,希望它快点成长。
“对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济,真正的机会是,基于通用大语言模型,抢先开发重要的应用服务。就像移动互联网时代,最成功的商业产品不见得是安卓和iOS,而是基于安卓和iOS开发的微信、淘宝、抖音等各种超级应用。”李彦宏说。
由此可见,百度给文心一言的定位,不仅仅是一个工具,而是一个通用的平台,百度想让各行各业来使用这个平台,进而创造价值。
李彦宏判断,大模型时代将产生三大产业机会,第一类是新型云计算公司,第二类是进行行业模型精调的公司,第三类是基于大模型底座进行应用开发的公司,即应用服务提供商,“今天,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,他们可能就是未来的新巨头。这里面的机会非常多,可以说每家企业在现在这个阶段都有机会。”李彦宏说。
华为“盘古”大模型
就在上周末,华为发布最新的盘古大模型。
值得注意的是,与“文心一言”等语言大模型不同,盘古大模型在消费端的应用并不特别突出,反倒是B端应用更惹人注目。
4月8日,杭州)中国人工智能学会主办的人工智能大模型技术高峰论坛上,华为云AI领域首席科学家、国际欧亚科学院院士田奇,分享了关于华为盘古系列大模型的研发与应用落地情况。
盘古大模型包括NLP(自然语言处理)大模型、CV(机器视觉)大模型、科学计算大模型、多模态大模型、语音大模型等多个模型。但在整个叙述中,华为方面对NLP语言大模型的着墨并不很多,而是更加聚焦于工业端方方面面的应用。
从华为方面的叙述中,也能看出来这次大模型跟同业有不少差别,华为跟以往一样更多看重AI for Industry(AI赋能产业),希望为煤矿、水泥、电力、金融、农业等行业创造更多产业价值。
根据介绍,几大模型已经陆续投入应用。其中,盘古CV大模型覆盖了工业质检、物流仓库监控、时尚辅助设计等行业;盘古NLP大模型覆盖了智能文档检索、智能ERP、小语种大模型等领域,比如去年交付了一个阿拉伯语的千亿参数大模型;盘古科学计算大模型也用在了气象预报、海浪预测等方向。
科大讯飞即将发布“1+N认知智能大模型”及应用产品
近日消息,科大讯飞副总裁、研究院执行院长刘聪透露,科大讯飞“1+N认知智能大模型”将在5月6日正式发布。
其中,“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”则是应用于多个行业领域的专用大模型版本。同时,“N”个场景的示范性应用产品也将随之呈现。
科大讯飞集团总裁吴晓如表示,以chatGPT为代表的技术表明机器在自然语言的处理能力上已实现质的飞跃,应该看到和open AI的差距并迎头追上。科大讯飞已储备了一段时间,很快会发布自己的大模型技术。
此前,科大讯飞表示,ChatGPT的推出是深度学习提出后又一个里程碑式的技术革命,认知智能技术的大规模应用处在“历史机遇期”。
在今年1月底以来的多次调研交流中,科大讯飞就多次被问及ChatGPT,并谈到公司的人工智能的业务。
在2月21日的调研当中,谈到公司在ChatGPT方面有哪些优势,以及公司对预训练认知智能大模型上能代表中国实现突破的信心和计划时,科大讯飞进行了详细阐述。科大讯飞表示,ChatGPT的推出是深度学习提出后又一个里程碑式的技术革命,认知智能技术的大规模应用处在“历史机遇期”。讯飞当前的关键,是要踏踏实实的实现技术的突破并在已有的应用场景中加快落地,我们对自己的信心来源于以下几方面:
1、核心算法优势:科大讯飞多年来在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程技术、算力支撑等方面形成了扎实的积累,在Transformer深度神经网络算法方面拥有丰富经验,已广泛应用于科大讯飞的语音识别、图文识别、机器翻译等任务并达到国际领先水平;
2、应用场景优势:算法的创新要依托具体的应用持续场景迭代,科大讯飞经过过去10年的努力,在认知智能方面开拓了丰富的应用场景,例如教育行业的因材施教和个性化学习、医疗行业的人工智能辅诊、智慧城市的便民便企服务、面向企事业单位的智能办公等等,过去3年已实现合计超过两百亿的毛利额(2020年58.76亿,2021年75.33亿,2022年预计75亿以上),就是上述应用深度和广度的体现。同时在严格遵守适用法律法规前提下,在多年应用推广中积累了超过50TB的行业语料和每天超10亿人次用户交互的活跃应用,为训练实现达到人类专家水平的行业认知大模型提供了海量行业文本语料和用户反馈数据;
3、算力的保障:讯飞在总部自建有业界一流的数据中心,为大模型训练平台建设奠定了很好的硬件基石。此外,在工程技术方面实现了百亿参数大模型推理效率的近千倍加速,为未来更大更多认知智能大模型技术经济实惠规模化应用提供了可能。算力平台已常态化应用于公司的AI算法研发,实现核心技术底座自主可控,并且满足了开放平台数百万开发者和其他行业伙伴的AI服务需求。
4、将进行产品级发布:在上述积累基础上,科大讯飞于2022年12月份进一步启动生成式预训练大模型任务攻关,科大讯飞AI学习机、讯飞听见等产品将成为该项技术率先落地的产品,预计于2023年5月6日进行产品级发布。