做人工智能的长期主义,商汤打通虚实结合创造全新范式

创业邦

    编者按:本文为创业邦原创报道,作者朱锋,未经授权禁止转载。
    上海临港,一座代表亚洲最强算力的新型人工智能计算中心(Artificial Intelligent Data Center,AIDC)即将在年底完工。如果将其全部算力用于视频处理,那么这座设施建成后,1天内能处理的视频时长可达到2.36万年。
    从今天向前推算2.36万年,人类还处在旧石器时代。
    当然,强大的算力并不只简单地用来处理视频。在未来的规划中,这个算力中心可同时满足四个2000万级以上人口超大规模的智慧城市需求。
    但这只是一个更加庞大规划中的一环。今年7月,商汤科技联合创始人、首席执行官徐立在世界人工智能大会上正式介绍了商汤前瞻打造的新型人工智能基础设施——SenseCore商汤AI大装置。而临港的AIDC和商汤已有的超算中心共同构成了这个“大装置”的算力基础。
    商汤“AI大装置”的中上层,是能够实现AI批量化生产和部署应用的算法平台,及面向企业和开发者的算法库。通过这套“大装置”,AI算法的训练和部署不再是门“手艺活儿”,人工智能的创新将全面实现降本增效。
    对于人工智能技术而言,落地不同的行业和领域,不再是需要投入大量人力的事情。对商汤科技而言,AI大装置的产生,意味着公司距离创业时设下目标的愿景,更近了一步。
    创立7年 商汤长线投入打磨底层技术
    把时间拨回到2015年,商汤团队开发出的算法首次在ImageNet大规模视觉识别挑战夺冠,算法准确率刷新了记录,比前一年谷歌的成绩高出6个点,并将算法发表在CVPR上,拉开了AI推动产业革命的序幕。这,是商汤原创技术发展的一个重要里程碑。
    坚持原创,一直是商汤科技的标签。从底层出发,做原创技术的有着非常多的优势,徐立认为,“在企业发展中,踏实做底层技术会有更大的机会。技术上的突破,创造的是蓝海市场;技术上的领先,带来的是产品的不同质化。”
    算法、数据、算力是构成深度学习技术的三个底层要素。为了构建深度学习原创技术的底层核心优势,商汤科技在成立之后,便快速投身于两件事:招募人才、自建超算中心。
    成立后的最初两年里,深度学习领域中最顶尖的华人科学家几乎都集中在了商汤科技的办公室里,数量一度超过了150人,他们的目标是把深度学习的学术算法创新搬到工业界,并不断夯实原创深度学习框架SenseParrots。相较于当时行业流行的开源框架,SenseParrots有着更高的算力利用率,能够高效训练出性能更强、种类更多的AI算法,这也成为商汤算法的创新基石,更是今天AI大装置平台层的精华所在。
    自建超算中心同样是商汤科技的长线布局,是为了拥有自己的算力规模。据了解,商汤的创始团队在一开始就建设为AI训练特制的超算中心。这也是AI大装置算力的前身。
    凭借这两项基础,商汤在2015年夺得ImageNet计算机视觉国际挑战赛冠军,甚至在2016年开发了1207层全球最深的深度神经网络再次在ImageNet上夺冠,这可以视作商汤后来探索AI大模型的先驱探索。彼时,徐立曾表示,“商汤得以不断挑战工业红线,创造新的应用场景的优势得益于三个‘最’——最早投入深度学习研究的华人团队、亚洲最大的深度学习研究团队、博士密度最高的企业。”
    在AI进入产业界的初期,也就是2015~2016年间,行业内更多看到的是AI技术在解决空间安全、交通管理等方面的市场潜能。但凭借对原创技术的坚持和理解,商汤拥有更长远的视野,自成立伊始,他们就以一个宏大目标“让AI引领人类进步”作为使命。而“让AI赋能百业”,正是实现这一使命的重要路径。
    正因如此,商汤希望做深度学习的“全能型选手”,让自己像发电厂一样,哪里需要AI,就能向哪里输送AI能力。商汤科技人工智能平台公司的定位,也由此而生。
    徐立还将商汤的这种商业愿景概况为两套工具,他曾表示,“传统企业的痛点归根结底就是效率和创新这两个问题,因此商汤科技正在做两个工具,一个是生产力工具,为传统行业降本增效;另一个是交互工具,带来新的交互体验,形成新的应用场景。”
    然而,无论是“赋能百业”还是“两个工具”,字面意义上都很好理解,但想要成功付诸产业实践并不容易。这要求AI企业必须拥有一套从核心技术突破到快速商业化的闭环。
    徐立指出,商汤的这套闭环,是由五个环节环环相扣:首先,是找到行业最真实有效的规模化刚需,并定义问题;其次,以行业需求的技术红线为标准进行基础技术的突破;第三,配合有效的数据闭环,让技术、数据和业务形成正反馈;第四,以更具优势的商业模式对传统行业进行核心价值要素的转移,推动产业升级,驱动快速、大规模的应用落地;最后,通过大规模商业应用带来的经济价值,为持续的技术创新能力提供坚实的基础保障。
    秉承这条从技术突破到产业落地的商业路径,商汤成功将自己的原创技术赋能于各行各业。与此同时,随着底层开发工具链的不断完善,商汤也逐步拥有了流水线一般的算法生产能力,自两年前开始,“算法工厂”成为了商汤新的符号,到今天,商汤开发出的算法模型数量已超过21000个,由此形成了AI大装置的算法层。
    到今年为止,商汤的AI技术已广泛覆盖智慧城市、智慧商业、智慧生活、智能汽车四大板块的多个细分行业和场景,并在多个垂直领域处于领跑位置。
    徐立认为,当创新的速度足够快,真正能够做到把创新和产业深度结合的时候,就拥有了一个超越行业创新均速的速度,这个速度就是“逃逸速度”。
    面向未来
    商汤打通虚实结合创造全新范式
    SenseCore商汤AI大装置的诞生,无疑是商汤厚积薄发的最佳体现。
    它代表的,是商汤过去7年来对原创技术的坚持,是从底层算力、完整的算法生产工具链,到面向不同行业的海量算法模型共同凝聚而成的精粹。
    它开启的,则是一个全新的“AI工业时代”。它将成为未来十年,甚至数十年AI发展的基础设施,凭借极强的泛化能力,让千行百业都能够更低成本、更高效率生产所需的AI能力,让AI技术触类旁通、连点成面,迅速规模化。
    中国信通院在《人工智能核心技术产业白皮书》指出,当前智能技术正在向更多的行业领域渗透,产业规模化发展的进程正在不断加速,AI产业已经处在了规模经济爆发前的临界点。
    这个规模有多大?据麦肯锡预测,到2030年,约70%的行业企业将使用人工智能技术,预计为全球增加13万亿美元的附加值。
    IDG资本合伙人牛奎光曾谈到:“人工智能技术的落地已经步入深水区,如何构建通用范式打破单点场景的应用局限成为了当下所有AI从业者必须面对的考题。攻坚需要集群体之智,自创立之日起商汤就凭借自身深厚的人才储备,从软件层、硬件层等多个维度不断优化自身的能力。相信未来商汤以自身的创新能力、坚实的技术基础,会将AI技术赋能于各个行业,让每个行业在数字经济中焕发新生。”
    在AI技术的规模化时代,AI将全面深入产业当中的各个链条、各个环节,由信息构成的数字世界,也将与真实世界实现无缝衔接、互联互通。此时,商汤的生产力工具和交互工具,也将不再是彼此独立的个体,而是将合为“虚实融合”的全新工具。前者将让传统行业“从实到虚”,全面实现物理世界的数字化,后者将全新开拓“从虚到实”,让虚拟照进现实,形成“虚实融合”的全新创新范式,实现数字经济的价值闭环。
    在今年的世界人工智能大会上,徐立将这一范式的实现,总结为“三步走”,第一步是场景的数据化——这是行业正在经历的阶段。即通过各式各样的传感器等设备,将物理世界的信息像素化、3D化,叠加到数字孪生空间上;
    第二步则是要素的结构化,即通过AI的感知、理解,将人、物、事、场进行结构化提取,成为对业务有意义的元要素;
    第三步是流程的可交互化,即通过对数字孪生空间中的元要素作访问、修改和互动,反馈并影响现实的业务流程,实现流程再造。
    这套创新范式,如今在“AI大装置”的支持下,已被全面贯穿到了智慧城市、智慧商业、智慧生活、智能汽车四大板块业务。
    商汤科技参与的上海市“一网统管”建设工程,便鲜明地展现了“从实入虚”的创新成果。
    你可以把它理解成是将现实投射进虚拟世界的“数字孪生上海”。它和真实世界分秒同步,同时又能让城市管理者突破物理空间的束缚,作出更加精准的决策和部署。
    以上海市长宁区江苏路街道的部署为例。在AI场景分割等技术的转化下,街道内的1000个摄像头化成为智能感知神经元,时刻关注区域内的各种问题。垃圾暴露,路面违规经营、道路积水、车辆违规停放等问题都能从图像中迅速识别,然后立刻派单给一线工作人员进行处理。街道网格监督员的工作模式,也由此从之前的撒网式巡查方式,革新为由AI智能搜索、推荐并派单的精准化治理方式。
    上述场景中,包含了大量的低频长尾需求。徐立指出,近80%大数据应用只是完成了第一步数据化,并没有将数据和真实业务流程结合。满足这些需求虽然有巨大的商业价值,但在人力投入、数据收集和算力满足方面面临巨大的成本压力。“AI大装置”的价值,就是真正意义上降低人工智能生产要素的价格,显著降低要素结构化和流程可交互化过程的难度和门槛。
    在智慧城市之外,打通虚实之间的次元壁,由AI进行智能搜索和推荐的模式,也正在社区、商业、医疗等领域创造出新的想象空间。
    以上海田林街道社区为例,社区管理应用AI技术实现了多方面流程的重塑和优化,例如可以第一时间辨别电瓶车进电梯、明火、占用生命通道等近年来居民关注的安全隐患,并自动作出相应的处置,保障社区高效、安全、有序运转。
    世界领先自动扶梯企业迅达通过融合商汤在物体检测、行为识别、密度分析等领域的AI技术优势,可以将电梯上的各类情景结构化处理,定义出乘客逆行、推行婴儿车、轮椅、携带大件行李,或是乘客摔倒等事件,并在事件发生时,及时报警,并采取降低运行速度或者停止电梯等操作。整个交互流程都能自动完成,重塑过去的被动化响应模式。
    医疗行业同样受益于此。商汤原创的SenseCare智慧诊疗平台,可以在CT、DR等设备数据化生成的海量影像信息中,对各类病灶特征进行结构化提取,为医生做出辅助诊断。在“AI大装置”的支持下,这套平台已经快速拓展覆盖到了人体十余个重点器官,覆盖诊断、治疗、康复完整工作流。
    我们的生活,则正在经历着“从虚到实”的过程,即在数据化之后,通过AI技术将虚拟世界的内容叠加到现实生活中,创造新型应用模式。比如基于商汤SenseMARS火星混合现实平台构建的AR导航体验,已经在成都国际金融中心、长沙黄花机场、杭州西湖等购物中心、交通枢纽、景区等场景提供特色服务:用户打开App扫描周边环境,便会在实时画面上获得通往目的地的贴地箭头和虚拟地标。
    不仅如此,在杭州西湖,商汤还将很多景点的历史典故转化为虚拟元素,给游客带来穿越时空一般的沉浸式体验。比如在放鹤亭,游客可以看到AR梅花、AR仙鹤,即便没有导游解说,也能感受到其中的历史韵律。
    智能汽车更是“虚实融合”的集大成者,在商汤SenseAuto绝影的支持下,汽车可以将实化虚,把道路信息结构化,看懂交通路况,从而做出正确行车决策,还可以将虚化实,把L4级自动驾驶与AR技术巧妙结合,首创出自动驾驶AR小巴,让乘客既能享受自动驾驶技术带来的智能与便捷,还能透过AR窗户,一览未来城市奇景,为园区、景区导览开创了一种全新模式。
    以上的场景,都还只是人工智能以空前广度和深度推动社会发展,加速产业结构升级的缩影。《中国人工智能核心技术白皮书》中指出,人工智能已经全面覆盖社会运行的基本要素,提升全局运转效率。如何建立高效的AI基础设施,成为驱动新一轮商业创新与竞争的关键动力。
    过去,机器更多扮演的是记录数字信息的载体,便于我们查询和决策,这种“机器辅助”的模式定义了我们今天的信息时代。现在,AI技术让机器进一步具备了洞察分析和决策判断能力,定义开启“人机协同”的全新时代,现实世界将得益于虚拟世界的联动大幅提高效率,虚实世界将通过对现实世界的增强创新生活体验。所有的行业、所有的业务都将因此得到重塑。
    “AI大装置”不仅是商汤长线竞争力的壁垒,更是这个长期愿景的支撑体。
    本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。