阿里达摩院发布“通义千问”,首席首测,学问如何?
首席商业评论
01
阿里这个大语言模型,成色几何?
大语言模型热之下,4月7日,阿里上线邀测了自己旗下的大模型,名字叫“通义千问”。
这个阿里大模型,号称是世界首个突破 10万亿参数的 AI 大模型,据说阿里还牵头搭建了国内国模最大的 AI 模型服务社区 “魔搭”。
不过缺点是,指令字数上限为1000字,大大限制了指令输入,目前也还不支持多模态。
阿里这款大模型到底成色如何?
首席商业评论拿到了邀请码,也问了通义千问几个问题,回答如下。
首先,我们测一个大家喜闻乐见的 “情感性”问题:我妈和女朋友掉河了,先救谁?
这是一个老问题,通义千问在这个问题上比较绕,似乎有一些倾向,但似乎又有一些矛盾。当然,这种问题本身就是刁难人,AI并没有装糊涂,下图的问答也算过得去。
再问一个简单问题:宫保鸡丁怎么做?通义千问在回答的最后不忘温馨提示。
我们再上点难度,问它如何评价“首席商业评论”?它给出的回答是:
不愧阿里官方给它的形容词之一就有“写彩虹屁”,这波彩虹屁还是可以的。
首席编辑表示比较满意:)。
作为商业号,我们又问了通义千问一些商业相关的问题。
周杰伦起诉网易不正当竞争,你觉得谁会胜出?
通义先给出了一个摸棱两可的答案,周杰伦起诉网易不正当竞争这个事件,涉及到著作权、商业竞争等多个方面,需要综合考虑各种因素才能做出判断,但后面也给出了自己的观点。
应该说这个回答还是相当不错的。
除了回答问题,我们又让通义千问给问界汽车做个SWOT分析。
这样标准化的问题似乎应该不会难倒AI,回答也可以作为很多人制作PPT的基础素材。
再来,以马云、马化腾、张一鸣三位大佬为主题,写首诗。
这个,似乎有点套模板了。
最后,请它用淄博烧烤为话题,写个淘宝文案。
从文案来看,格式是有内味儿了,但内容还是不大符合事实,看来通义是把淄博烧烤当成一种食材,可以送礼,可以在家自制,而不是城市路边摊。可能在最新数据上并没有接入最新的互联网热点。
从这些回答来看,通义千问在涉及到商业、科技等理性问题上,分析还算比较有逻辑,给出的回答让人基本信服。但在涉及到文学问题上表现略为逊色,写出的诗或文案,还是有硬套模版的感觉,比较生硬,整体上中规中矩。
总体来看,通义千问还是有着不错的能力的,但想要真正代替打工人写文案,恐怕还得让打工人们再费心多调教了。
首席的朋友们,如果你们想对“通义千问”提问,请在评论区留言,我们将抽取部分问题来代为提问。
02
从社交到办公,各个大厂都在卷
最近,很多公司在大模型领域已经杀疯了,短短10天,就有5场大模型发布会已经或将要与众人见面。
名字起得都相当文艺,气势上谁也不想输于对手,不少公司都是从传统文化里汲取灵感。
阿里的通义,取自《汉书》中的“天地之常经,古今之通义也”,有“普遍适用的道理与法则”之意。作为一个大型预训练语言模型,“通义千问”在训练过程中学习了大量的文本数据,从而具有广泛的知识和普适性,可以针对各种领域的问题“对答如流”。
而“千问”,阿里巴巴达摩院给出的官方解释是“千万次的问,千万的学问,能问出千问的一定是真爱,能回答千问的也一定是真有学问,以及AI和我们一样,都有千万次交互的热情”。
腾讯AI大模型,是从道家学说中“取经”——“混元即无极,无极生太极,太极生两仪,两仪生四象,四象生八卦,八卦衍万物”。
根据这句经典的道家语录,腾讯将机器学习平台命名为“太极”,基于此平台研发的AI大模型命名为“混元”。
腾讯的混元AI大模型包括计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向,已广泛应用于腾讯微信搜索、腾讯广告等业务场景。
据总裁Martin所言,该大模型未来还会应用于各业务当中,除社交、通讯和游戏业务外,聊天机器人、数字助手、资讯获取等方面也将是腾讯的尝试方向。
网易也给自家大模型取了个极文雅的名字——“玉言”,取自“金口玉言”一词,即对别人所说话的敬称。
“玉言”大模型脱胎于网易伏羲,训练语料主要来自小说、百科和新闻等,模型规模从最早的一亿参数增长至千亿参数,模型领域也从文本拓展到图文、音乐、行为序列等多种模态,其具备的自然语言处理能力可应用于语言助手文本创作、新闻传媒、智能客服等领域,甚至在多项任务上超过人类水平。
此外,网易有道还将于近期推出教育场景下类ChatGPT模型——“子曰”。基于“子曰”研发的AI口语老师和中文作文批改DEMO已完成,近期开放内测,“子曰”在古代是各家学生对老师的尊称。
华为发布的大模型,命名为“盘古”,延续华为取名的霸气,此大模型的名字来自于“盘古开天”的神话,华为宣称将在智慧教育、企业数字化、工业互联网等领域带来新应用创新思考的科大讯飞“1+N认知智能大模型”。外界解读称这寓意着华为将通过输出技术能力与产业融合,使AI走向千行百业打开新空间,
昆仑万维也高调发出大型预告——和奇点智源合作自研的“天工”大模型将于17日启动邀请测试。
昆仑万维还自豪地表示,“天工”已经非常接近ChatGPT的智能水平,会是中国第一个真正实现智能涌现的国产大语言模型,于 4 月 17 日启动邀请测试。昆仑万维表示,天工大模型已经非常接近 OPENAI ChatGPT 的智能水平。
更早之前,4月10日,商汤科技发布了“日日新”大模型,并现场展示了类ChatGPT的“千亿参数”中文语言大模型应用“商量”,日日新 SenseNova 大模型,包括自然语言生成、文生图、感知模型标注以及模型研发功能。
360也发布了大模型,叫360AI。从演示效果来看,360版GPT具备一定的推理能力,但在回答具体问题时多次“翻车”,甚至需要多次回答才能给出准确答复。
很多人觉得,跟文心一言尴尬的录播相比,360至少是用现场实机演示,并随机选取观众进行提问的,还算比较有诚意。
相比以上公司的大张旗鼓,字节则是从旗下办公软件飞书低调切入,最近飞书表示每位飞书用户都会拥有专属的智能助手——“My AI”,另一边,钉钉也不甘落后,宣布AI智能助手。
整体来看,大模型已经渗透到各个领域,只要跟人类生活大数据相关的,都可以产生大模型。
比如连汽车相关的公司都要来做大模型,毫末智行发布自动驾驶大模型—-DriveGPT雪湖·海若。
最近阿里云峰会召开,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇也表示,阿里所有产品未来都将接入大模型升级——包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。
就目前来看,如今市面上的产品,足已让人眼花缭乱,产品越多,竞争越激烈,谁能从极度内卷的市场脱颖而出,不是靠吹牛,还是要拿实际的效果说话,让大众认可。
03
监管、人才、VC……配套都要跟上
GPT热之下,永远不缺入局者。
除了大厂已经面世的产品之外,不少创业老炮正在跃跃欲试,创建新团队,想要做出自己的大模型。
两个月前,一位互联网老兵王慧文高调“带资进组”,同样拿着5000万美元开启创业,宣称要做出中国的OPENAI。
王慧文此前在美团工作多年,2020年底退休之后,王慧文很少出现在公众视野,直至今年发力大模型,做了一家名叫“光年之外”的新公司,有传言称光年之外已经启动第二轮融资,估值10亿美元。
王慧文并非技术背景出身,主要任务是给光年之外找钱、找人。
此前已离开搜狗的王小川也在今日正式宣布加入中文大语言模型竞争,王小川称,年底要做出对标GPT-3.5的大模型。
据悉,王小川的“百川智能”早前已经获得了5000万美元启动资金,初步搭建起来自搜狗、百度等技术骨干在内的团队,在员工尚未正式入职、完全远程协作的情形下开始了500亿级大模型的训练。
与此同时,前京东AI掌门人周伯文的衔远科技也随即宣布完成数亿元天使轮融资,表示做大模型并非大厂专属。
缺人才,是目前行业的普遍问题,AI热也激发了市场对大模型相关人员的需求。据“投资界”信息,一名投资人透露,北京某知名VC委托寻找多位AI方向投资经理,薪资范围6-9万,招聘网站显示,AI方向VP-MD,最高月薪20万。
脉脉高聘人才智库数据显示,2023年AIGC人才招聘需求激增,1月份至2月份发布的AIGC岗位数量同比增长35%。在热招岗位中,图像识别、算法研究员、深度学习等岗位的年薪均已达百万元。有猎头透露,一些高估值项目的人才薪资涨幅能超过100%。
随着ChatGPT等类似应用越来越火热,未来因生成式人工智能引发的社会问题也将快速增长,各种真假AI越来越多,监管方开始重视,尝试制定制度管束。
最近,国家网信办发布《生成式人工智能服务管理办法(征求意见稿)》(下称《管理办法》),向社会公开征求意见。
在美国,据华尔街日报,拜登政府也已经开始研究是否需要对ChatGPT等人工智能工具进行审查,因为人们越来越担心该技术可能会引起歧视或传播有害信息。
中南财经政法大学数字经济研究院高级研究员金天认为,在越来越多的企业布局生成式人工智能业务之际,国家迅速启动相关领域政策法规制定工作,将更好促进生成式人工智能技术健康发展和规范应用。
相关监管方重视大模型,其实这也是行业利好信号,给诸多从业者及投资人保驾护航,尽量避免数据滥用、隐私泄露等负面事件的出现影响行业信心。
某种程度上,这是很多新技术公司的时代机遇,毕竟在生成式AI这样大厂并不占据先天优势的赛道上,崛起的概率并不低。总之,互联网新浪潮下,一场关于核心技术生产力的战争才刚刚开始。