人工智能跑向“最后一公里”

阿尔法工场

    谁有更低的成本、更早的布局、更快的技术迭代,谁就能成为最终冠军。
    AI还能干什么?
    1970年,第一代神经网络算法问世,证明了《数学原理》前52个中的38项。
    此后,AI不断突破迭代,“折叠”生产力时空,将人类从重复劳作中解放出来。
    近年来,随着各行各业高度发展,信息量和应用场景也呈指数级增加,算法模型逐渐步入深水区。而AI落地的场景,大多数仍然有限,并未能发挥最大效能。
    怎样的AI技术,能够持续赋能行业,解决更为细碎但常见的长尾问题?乃至跑向机器“拓荒”思考的“最后一公里”?
    AI现在需要“解放自己”,展开一场范式转变。
    欲知未来,先看历史。因此,有必要从人工智能应用落地的第一阶段,看AI如何一步步构建和影响身边的世界。
    01 教会机器“看脸”
    当代生活对人工智能最直观的认知,来自人脸识别。
    人脸识别,是AI众多技术中最早、最为成熟的技术。现如今,在各个场合“刷脸”已经成为一种常态,比如交通运输场景中,刷脸登机、入闸、安全检测等。
    但人脸识别被广为人知的应用,当数智能美颜。经过智能美颜“点石成金”,照片变得精致动人。
    虽然“一切看脸”难免失之狭隘,但人类70%-80%的信息获取来自视觉。人脸识别让人工智能具备了识人知物的能力。
    简单来说,视觉AI就是研究如何让机器会“看”,即用摄影机和电脑代替人眼对图像进行特征提取和分析,并由此训练模型对新的图像数据进行检测、识别等任务,建立能够从图像或者多模态数据中获取信息的人工智能系统。
    作为人脑之外的另一种智能,在认识世界之前,先要认识人类。模仿人脑学习过程的深度学习的内核,也是构建特征模型。人的面部信息,是社交及传播行为的重要载体,具有丰富的数据基础和重要的应用化需求。
    因此,人脸识别成为人工智能诞生60年来的爆发“奇点”。深度学习从人脸识别开始,劈开一条道路。
    此后,人脸识别技术在各行业领域,都得到了应用。在商业楼宇,可用来录入门禁考勤系统;互联网APP为面部设计出好玩的滤镜,创造新奇社交体验;银行系统用上了便捷且具有高安全性的刷脸支付;而智能手机厂商的人脸解锁和智能美颜,大概是日常最频繁的应用。
    人脸识别在诸多领域的应用,打开了广阔的蓝海市场,也滋养了一批AI技术企业和应用企业,诞生了商汤(0020.HK)、旷视科技、云从科技等AI企业,同时百度(BIDU.O)、阿里(9988.HK)等互联网厂商也积极切入人工智能领域。
    发展到现在,AI人脸识别技术已非常成熟,甚至被打上基础技术的符号。以精度、准确度为导向的技术驱动力量正在减弱,而用户对产品使用场景适配度的要求,却越来越高。
    而人工智能技术的应用,远不止于此。
    02 在长尾场景中,重识世界
    随着人工智能技术的迅速发展,现如今AI的应用已经突破了识别人自身的第一阶段,进入了第二阶段——即对人周边已知领域的探索,体验人能感知到的现实世界。
    在第二阶段,人工智能的使命,和第一阶段有所不同。
    从人脸识别,过渡到识别万物、实现万物互联;从标注图像中的单一要素,到识别物体组合和场景,甚至是物体与场景的关系。
    从数据化到结构化,乃至可交互化,是人工智能第二阶段的使命。
    只有将时间、地点、人物关系有机串联,才能真正令AI“理解”和学习人类世界的真实状态,以解决在第二阶段大量出现的长尾问题。
    所谓长尾问题,即AI应用中出现的差异化、碎片化和细节化的需求。现在的应用场景中,80%都是此类低频、长尾的需求。能否解决这些长尾需求,是AI大规模产业化落地的关键。
    以城市管理为例,城市是一个复杂的系统,要想让城市真正实现有序地运转、高效的治理,仅仅依靠人的力量是不够的,借助人工智能的力量,可以让治理更高效。
    如今,虽然“智慧城市”方案已在很多地区落地应用,但真的利用AI技术去解决细节问题,需要面临成千上万的治理元素,比如共享单车乱停乱放、消防通道被占、垃圾桶满溢、积水阻碍通行等。
    商汤试图挑战这个问题,并取得了新进展。2020年,他们与上海市进行合作,基于商汤SenseFoundry方舟城市级开放视觉平台,构建了多场景、一站式的解决方案。长宁区的AI+一网统管试点,“智慧巡屏”等功能,就是AI研判处置全闭环管理的案例。
    AI打通城市管理闭环后,有效地解决了城市暴露垃圾识别、共享单车乱停乱放的痛点,不仅能帮助城市管理者发现问题,还能在案件被处置后自动核查,甚至将管理模式转变为主动发现。
    商汤SenseFoundry方舟企业开放平台,还将AI应用于上海徐汇滨江水岸的生态管理中。
    上海徐汇滨江岸线长达11.4公里,沿线入驻近500家企业,有近20多万人员通勤,以及每天数以万计的游客。如此大面积、多人流、偶发事件频繁的环境,日常运维管理难度极高。
    但现在的水岸区域,是具有“城市生命体征”的智慧水岸——针对各种“突发事件”,均可构建从自动发现、预案触发、任务分派和复查的一体化管理体系。
    
    徐汇滨江智慧公共空间管理平台,来源:商汤官方公众号
    从区域内座椅、灯杆、井盖、绿植、草坪、建筑等16000+资产建档,到自动告警派发工单,甚至花花草草的养护需求,都能有条不紊一一照顾到,这种“能感知、主报告、有温度”的“智慧公共空间管理平台”,由SenseFoundry Enterprise商汤方舟企业开放平台的AI赋能而来。
    见微知著。一个个AI长尾问题背后映射出的,是AI发展趋势。
    根据Gartner发布的《2021年AI成熟度曲线》显示,AI发展主要面临4个趋势,具体包括:负责任的AI、小而广的数据方法、AI平台运营化、高效使用数据、模型和计算资源。也就是说,AI的发展最终要走向高效使用数据、模型和计算资源方向。
    成熟曲线显示,目前很大比例的AI创新,依旧在上升型的技术萌芽期,AI工具还无法达到最终用户需求所具备的能力。这其实意味着,大部分AI的应用依旧处在研发环节。
    
    2021年AI成熟度曲线,来源:Gartner(2021 年 9 月)
    当前AI还在以快速的步伐发展,“成熟度曲线”上大部分技术,有希望在2年至5年内得到业界采用。边缘AI、计算机视觉、决策智能和机器学习等在内的创新,都会在未来几年对市场产生革命性的影响。
    与真实世界的拟合度越高,越需要构建高复杂度的识别算法模块。对下游行业来说,这无疑是巨大的难题。即使需要AI技术,也很难再投入重资产开发。
    具有行业精深的专业知识、甚至掌握客户资源在手,但苦于缺乏开发能力和项目管理经验,而无法施展所长,这是诸多垂直类行业解决方案的中小企业的核心痛点之一。显然,他们需要能快速上手、能辅助项目尽快落地、提升项目研发效率的产品。
    Gartner 高级首席分析师Shubhangi Vashisth认为,平均而言,将基于 AI 的模型集成到业务工作流程中,并交付,需要大约8个月的时间。”
    因此,对下游企业来说,如果有了强大的深度学习通用模型和众多模型组件,并能与行业属性相结合,无疑是最为便捷、成本最优的AI解决方案。
    另外,某些低频次但高“赔率”的场景,如火灾、危化品泄漏防范等,也是非常核心的需求。如能解决这样的问题,便能带来巨大的商业价值。
    应对上述需求的深度学习模型,参数规模也相当可观。相应地,对算力这一基础设施的要求也越来越高——过去几年翻了100万倍,几乎是以平均每年十几倍的速度增长。
    商汤AI大装置就是这样的算法与算力模型“工厂”,能有针对性地解决行业痛点,即长尾问题。
    03 商汤AI大装置:AI突破行业成本红线
    2019年,商汤便开始了SenseCore商汤AI大装置研发, 这是一种高效率、低成本、规模化的人工智能基础设施。目前,已经为长三角区域大量科研单位和头部企业提供了算力、数据、算法全领域的核心能力服务。
    SenseCore商汤AI大装置核心架构,由计算基础设施、模型层和深度学习层三部分组成。
    计算基础设施,即是支撑数字经济坚实基础的算力“基建”,数字经济时代的新型生产力。
    坐落在上海临港的商汤人工智能算力中心(AIDC),为亚洲最大,峰值算力可达3740P,可同时接入850万路视频,1天内即可完成23600年时长的视频处理工作。
    “P”即 PetaFlops,指每秒千万亿次浮点运算。数字越大,运算速度越快;算力也越高,能训练的模型数据也更多。
    算法方面,AIDC具备超大规模的AI模型生产能力,可以进行更为通用的大模型训练。
    在大数据应用领域内,快速生成稳定可靠的模型十分重要。商汤的SenseSpring“模型工厂”,已经开发数万个人工智能模型。这些模型将用于大数据应用的各个领域,如数字化转型、智慧城市智能汽车、商业领域等等。
    除模型工厂外,开源算法体系OpenMMLab平台,也将与外部资源协同,共建新型生态。由商汤参与打造的OpenMMLab, 在世界上最大的代码平台GitHub上,已经获得超过58,000个Stars。
    算法训练平台,是商汤SenseParrots深度学习层。该平台采用领先的视觉训练框架,具备接近90%的并行处理效率,可以实现900倍计算提速,也就是,仅需要1块GPU,就能实现 1000块的工作效率。
    这样的巨无霸型AI装置,如何赋能下游行业呢?
    在工业领域,人工智能尚未取得较高的效益。一个原因是,工业数据虽然量大,但是相互关系十分紧密。数据与数据之间,有明确的逻辑,本质上属于小数据的范畴。
    由于需要特定的高性能AI模型,因此生产成本高昂,模型开发效率低,导致市场大量需求无法满足。另外,某些低频发生、规模量小的数据集,难以训练出高性能的AI模型,也成为工业级人工智能落地的一个障碍。
    而SenseCore商汤AI大装置,通过整合强大的算力基础和领先的算法能力,能以高效、自动化、集约化的方式,让高质量的AI算法实现“量产”。
    比如,通过向企业开放算法模型工厂进行定制化生产,大幅降低人工智能的生产要素成本,实现高效率、低成本、规模化的AI创新和落地,进而打通商业价值闭环,解决长尾应用问题,乃至构建出物理空间的数字化搜索引擎。
    更有意义的是,AI企业在垂类领域的商业影响力越强,越有利于AI多元化落地的发展,最终搭建起辐射多行业的AI商业生态。
    在能源、基建、物流等行业,数字化转型过程中面临很多痛点。大到工业园区的统筹、生产与运营资产的安全和运行维护,小到对工业品质检,场景多,需求复杂且细碎。
    而商汤AI大装置的“能力圈”,不仅在于分布地域广阔的工业基础设施,铁路、电网等设备运营维护,即便是安全规范的车间生产区域中,AIDC也能通过智能化的AI感知,实现对车间、厂房、产线、车辆的实时智能安全管理,使用自动化预警措施,降低安全事故的发生率。
    国家电网“多站融合”的数字化转型中,国网综合能源服务集团有限公司得以被商汤AI赋能,成功提升了运维体验和效率,推动了现有变电站资源的整合。
    另一个频繁可见的工业场景在汽车行业。
    汽车产品质检环节,也是一个长尾场景,很多细微的瑕疵,需要被快速精准定位。
    无论是商汤协助一汽青岛汽车厂开发的业内首条“5G+AI”冲压件表面质量在线检测线,还是与发动机厂商康明斯合作研发的深泉质检推训平台,都在零部件的表面缺陷和工艺过程检测效率,以及质检结果输出的一致性上,有了极大改善。
    商汤科技联合创始人兼大装置首席科学家林达华表示,当人工智能进入到这个行业时,会发现它整个生产链条非常长,商汤遇到了很多长尾场景,在响应每个具体需求的时候,成本和代价都是非常高的。
    因此,要让人工智能成为未来整个国民经济发展的根本,就需要突破一个新的红线,即成本红线。
    SenseCore商汤AI大装置的出现,在某种程度上,意味着AI助力下游行业走到了成本下降的关键节点。
    04 颠覆式创新,猜想未来
    2016年,AlphaGo在围棋大战中击败了韩国围棋冠军李世石。
    2020年,开源人工智能系统AlphaFold测出35万种蛋白质的结构,解决了困扰生物学界50多年的蛋白质测序难题。
    2022年,谷歌旗下人工智能企业DeepMind使用“深度强化学习”,首次在模拟环境下实现了控制核聚变。
    在人类有能力探知的领域,人工智能可缩短工作时间、提高工作效率。
    例如,在澳门镜湖医院,SenseCare??Cardiac心脏冠脉智能临床系统,能全自动完成高精度的心脏分割、冠脉提取与三维重建,大量减少医生手动后处理的工作量。
    但人工智能贡献不仅限于此,更大的意义在于,它能够探索“不知道自己不知道”的领域,依靠未知数据的发现和利用,以令人类惊叹的方式,重绘新世界的图景。
    癌症至今是人类的世纪未解难题之一。而肝细胞性肝癌(HCC)是全球第六大最常见的恶性肿瘤,死亡率仅次于胃癌和食道癌。
    在手术切除HCC后,仍有60%-70%的患者五年内出现复发。肿瘤异质性(肿瘤的生长速度、侵袭能力、对药物的敏感性、预后等产生的差异)的存在,使患者预后生存情况,与治疗期与治疗方式的相关性不高,难以预测,给肝癌精准治疗带来极大挑战。
    但基于人工智能方法建立的预测预后模型,能够兼顾精准度与实用性,且与现有的临床工作流程完全兼容。
    浙江大学医学院附属邵逸夫医院放射科胡红杰教授团队,联合温州医科大学附属第一医院杨运俊教授团队和商汤科技,基于364例多中心数据建立CT影像组学模型,预测HCC患者在手术切除后的无复发生存期(RFS),帮助临床进一步筛选可能从术后辅助经动脉化疗栓塞术(PA-TACE)获益的患者。
    最重要的是,使预后预测方式,从宏观的肿瘤形态分级,进入到通过人工智能细化肿瘤的微观生物学信息,这将有助于降低HCC患者术后复发率,提高总体预后。
    在这些提高诊疗效率措施的基础上,新药研发同样被AI赋能,从而大幅度缩短研发周期、降低药品研发成本以及提高新药研发成功率,突破人类创造力边界。
    2021年,商汤发布以AI技术“猜想”新药的研究成果,全面覆盖药物研发、临床研究、临床试验、新药上市后等多个环节。
    其中,最为“惊艳”的是辅助新药发现。靶点是药物发现的开端,而新作用靶点的机制,建立在对蛋白质相互作用(protein-protein interactions,简称PPI)的研究上。
    传统PPI研究方法耗时漫长,且难以有效对PPI分类;即便后来进步到计算机模拟,仍是一种“已知推算未知”的底层逻辑,无法直接泛化应用于未知新蛋白及PPI。
    针对此点,商汤团队有两个创新方案。一是训练出一套能够学习PPI的GNN(图神经网络)模型,优化了在未知PPI上的预测性能;二是重新划分数据,衡量模型在跨数据集和未知新蛋白的性能效果。
    商汤的创新方案,比传统方法提高了36%的预测精度。
    
    高鲁棒性的基于GNN的PPI分析框架,来源:商汤公众号
    不只医学领域,在游戏训练中,商汤的AI智能体,也有优秀作战能力。
    《星际争霸2》是业界公认的具有超高游戏难度、公平竞技性的即时战略游戏。给AI玩家带来挑战的是,需要多个智能体在复杂环境中的相互竞争、相互协作,且并不存在唯一的最佳策略。
    不同于围棋、象棋等规则明确的游戏,在《星际争霸2》中,对局存在大量隐藏信息,有高度不确定性。即使是一局对战里,也需要频繁切换策略、把握长短期目标,控制宏观与微观的单体平衡。
    这对AI机器人造成了挑战。因为仅依靠堆积算力解决不了问题,强大的直觉、预测、推理等模糊决策能力同等重要。
    依靠SenseCore商汤AI大装置海量算法和卓越的算力,商汤以较低成本开发出原创游戏AI生产平台。
    在分布式训练流程中,AI“左右互搏”,不断博弈,生成大量对局。历经不断进化后,AI智能体像AlphaGo一样,最终达到了战胜人类高手的对战水平。
    最有意思的是,这些平台不仅能应用于游戏中的“人机对战”,还能进一步延伸到现实生活中的城市管理、交通调度、自动驾驶等智能决策交互难题,探索“颠覆式”创新。
    探索未知,不仅仅是延伸,更是模型重构。从某种意义上,产业价值得以再造,甚至颠覆原有格局,推动AI商业化进入一个新的上升螺旋通道。
    探索元宇宙“生存”,如何能“真实”地在消费场景中应用,带来新鲜的消费体验?
    在广州悦汇城的周年庆中,商汤给出了答案。基于商汤SenseMARS火星混合现实平台,带来更多“元宇宙”超现实体验。
    空中盘旋的巨大冰龙、梦幻的冰雪城堡、可爱的动物冰雕、AR红包雨、AR集图打卡等有趣的功能,营造出超现实的氛围感,令人沉浸其中,忍不住想参与进来。在周年庆的10多天里,广州悦汇城全场销售额提升了196%,会员增长74%。
    元宇宙,还可以是“汽车元宇宙”。
    2021年7月,商汤发布智能汽车解决方案SenseAuto绝影智能汽车平台,此后不断迭代,到目前已完成从智能座舱到智能驾驶(L2-L4)以及V2X业务的全面覆盖。
    商汤绝影平台(SenseAuto)由五大产品组成:即SenseAuto ADAS、SenseAuto Cabin、SenseAuto Empower、SenseAuto RoboX及SenseAuto V2X。
    “corner case”指在复杂系统的测试或是除错过程中,由极值参数构成的边角案例。但这些边角案例的发生,往往是智能驾驶中不可接受的行驶风险。
    SenseCore商汤AI大装置提供的强大的算法和算力支持,令商汤绝影团队能够顺畅迭代针对性模型,化解掉各种边角案例的极端场景。
    比如车辆出入车库,穿行于林间道路时,强烈的光线反差导致驾驶员出现的“阴阳脸”,包括眼镜反光、大角度侧脸场景等,都给感知算法带来极大挑战。
    在本田中国近期发布的两款首发车型——东风本田e:NS1与广汽本田e:NP1中,借助车舱内置的红外单目摄像头,商汤绝影平台SenseAuto Cabin-D驾驶员感知系统,可实时感知驾驶员的表情、视线、姿态动作,准确判定疲劳、分心、危险动作等危险驾驶隐患,并及时预警。
    目前为止,SenseAuto绝影智能汽车平台已有累计超过30家汽车行业客户,累计前装定点数量达2300万台,覆盖未来五年内量产的60多款车型。
    在高工智能汽车研究院近期公布的“2021年度中国市场乘用车前装座舱AI软件供应商标配搭载量”排行榜单中,商汤以9.47万辆搭载上险量、15.79%的市场份额高居第一。
    日前,商汤科技与广州汽车集团有限公司签署了战略合作协议。双方围绕智能驾驶、智能车舱、智能网联、汽车元宇宙、AI工具链、超算中心等多个领域展开合作。
    今年和明年,商汤与广汽传祺、广汽埃安合作的多个车型,将陆续量产上市。未来,还将有更多车型搭载商汤绝影智能汽车平台。
    但AI的终极议题,是普惠人类生活。
    05 共生时代,AI普惠生活
    8月9号,商汤正式发售由中国象棋协会权威认证的“元萝卜SenseRobot”AI下棋机器人。
    可爱的外形、酷酷的机械臂看起来科技感十足。人机对弈、象棋教学、残局闯关等有趣的功能,让无论是初学者还是具备一定象棋水平的玩家,都能找到适合自己的对弈等级。与元萝卜一起学习,甚至能考取中国象棋协会认可的棋士等级证书。
    
    “元萝卜SenseRobot” AI下棋机器人,来源:商汤官网
    这是商汤首款家庭消费级人工智能产品,也是AI的一步普及性探索。未来AI的发展,必将惠泽万家。
    但探索真正未知宇宙的前提,仍然是算力和算法的“基建”设施,足够完满。
    电力、汽车、医药、消费、城市管理……这些案例,几乎触摸到了各行业疑难杂症的边界,但仍然只是AI能做的冰山一角。
    千行百业都能实现智能化升级的前提条件,即万物数字化、智能化。而AI行业发展到新阶段的必要条件,即是打通闭环、解决长尾问题。
    谁能以更低的成本、更早的布局、更快的技术迭代解决好这个问题,谁就能成为人工智能跑向“最后一公里”的决赛冠军,打开巨大的商业空间。
    8月19日,恒生指数公司宣布截至2022年6月30日的恒生指数系列季度检讨结果,所有变动将于2022年9月5日(星期一)起生效。其中,商汤-W被纳入恒生中国企业指数成份股。
    恒生中国企业指数,反映的是在香港上市的大型中国企业的表现,涵盖50家市值最大、交易最活跃的港股中国企业。
    在产业规模超过4000亿元、企业数量超过3000家的人工智能行业,不仅有小而美,还有大而强。
    当虚拟世界真正映射到现实世界,人类对机器的“驱使”,也将转变为机器对人的照料。
    AI在这一过程中,所赋能的功能意义,是使机器“接地气”,变得有温度,有人文情怀,也更有力量和智慧,参与到人类社会历史的进程当中。
    从高深莫测的黑科技,变身为辅助工作、生活不可或缺的重要组成,持续提供创造力的灵感,是人类世界对人工智能最深切的愿景。