“AI”增速放缓「数据价值洞察」仍是发展内核

AiChinaTech

    
    人工智能领域的增速放缓,主要体现在AI应用程序的部署增长方面。原计划23%的数据将在2019年被应用部署,而截至目前,只有5%的数据被应用部署,增长率明显低于2018年。很显然AI正在被某些“因素”拖累,比如相关领域企业员工缺乏相应的技能、企业可获得数据的质量以及对AI真实优势和用途的了解并不全面。
    对于人工智能而言,大数据是人工智能研发的重要基础。目前人工智能领域的研究细分有很多,包括机器视觉、自然语言处理、深度学习、机器人学、知识表示、自动推理等,研究方式上各有不同,但是数据收集、数据整理、算法设计、算法训练等是它们绕不开的研究路径,人工智能的核心是算法设计,但基础仍是大数据。
    而数据洞价值察或许仍是“稳定”人工智能发展的重要因素,在细分领域上有着不同体现,比如“增强分析”技术在数据与分析领域的应用、嵌入式人工智能在物联网领域的应用、浮层互动技术在视频领域的应用等。
    “增强分析”的概念最先被Gartner在2017年提出,“增强分析”曾誉为「数据与分析市场内的下一波颠覆性技术,是数据分析的未来」增强分析指的是在传统分析功能中加入更多的增强功能,这些功能大多是通过人工智能、深度学习等技术来实现,可以帮助分析人员对于数据进行自动化、精细化、结构化的分析,有利于进行更加精准的模型训练,从而满足多种数据分析需求。
    
    当前的增强分析功能主要有两种应用方式,一是帮助专业的数据分析师或数据科学家,通过数据建模来提升数据分析的能力。二是针对普通的用户,增强分析可以支持他们访问有效数据,并对理论和假设情况展开测试与验证,从而为分析计划带来更多自动化动能以及创新洞察力。在增强分析技术实现上主要包含以下三种工具。
    1、增强数据准备(Augmented Data Preparation):采用机器学习(ML)/人工智能(AI)自动化来扩大和加速数据剖析和数据质量、数据协调、数据建模、数据处理、数据聚合/推理,元数据开发,以及数据编目,这种增强趋势同样能够改变数据管理的各个方面,包括自动化数据集成和数据湖管理。
    2、应用于分析和商务智能系统的增强分析技术(Augmented Analytics As Part Of Analytics And BI Platforms),该技术使商务用户和“民间数据科学家”(Citizen Data Scientist,指那些能够进行数据建模的非统计分析专业领域的人)无需建模和编写算法,就能自动寻找数据规律,将相关结果以可视化的方式表达(比如相关性、例外、集群、连接和预测)。用户通过可视化和对话界面来研究数据,采用自然语言问询技术来查找用户情境下的最重要数据结果。”民间数据科学家”可以采用增强分析技术来客观分析数据。
    3、增强分析数据科学和机器学习(Augmented Data Science And Machine Learning)——采用ML/AI实现数据科学和ML/AI建模的自动化,比如特征工程和模型筛选,以及模型运行,模型解释以及最后的模型校正和管理。增强分析技术的应用,将会降低对高级分析模型操作的技巧性要求。它向民间数据科学家和应用开发者开放了数据科学和ML内容创造,最终,这些专业的数据科学家拥有更多的时间来聚焦创造性任务以及建立和运行最相关模型。
    增强分析在企业销售中的应用可以体现在精细化的数据洞察方面。过去,我们从销售报表中可以看到销售数据的上升或下降,通常最直观的数据维度只有价格、产品质量、人员因素等,但是这样的推测并不是完全准确的,「增强分析」的应用可以通过BI工具获取数十个甚至上百个维度,不光包括价格、用户等直观因素,甚至还包含天气、环境、交通等外部因素。其应用的意义就在于通过更多工具分析更多维度,力求找到问题解决的最优路径,对数据全面洞察。
    Gartner 公司的Julian Sun曾表示,目前的数据分析模式多是可视化形式,或者拖拉拽形式做数据分析,很有可能会造成另外一种孤岛——分析孤岛。这个时候用增强分析可以把这样的增强分析模式放到业务情景当中,最契合业务实际做一些业务针织。
    小结:在增强分析领域,数据洞察能力集中体现在分析维度会更加全面,那些曾经不被大家注意的数据可能就是导致“结果”的原因,就像“蝴蝶效应”一样。
    嵌入式人工智能(Embedded artificial intelligence)
    通过数据洞察带来的“赋能”效果在物联网领域和互联网APP产品方面也有体现,IDC和Forrester对2020年顶级人工智能的预测中提到,“至少 90% 的新企业 APP 将包含嵌入式人工智能功能。然而真正有颠覆性人工智能主导的 APP 将只占总数的 10%”。
    许多新的APP在前期设计中大都包含或多或少的人工智能功能,对数据的获取和整理的能力有了显著的提升,便于平台方对APP的运营。而更深入地嵌入式人工智能应用正在围绕物联网领域展开。
    
    嵌入式人工智能是让AI算法可以在终端设备上运行的技术概念,更加直观的理解就是让手
    机、音响、机器人、自动泊车等智能硬件,在不联网的情况下独立完成环境感知和人机交互等。对于AI工程师而言,将编写好的程序嵌入到各类智能设备的控制主板中,再测试运行效果,即算法是否能高效地在主板上运行。
    因为物联网应用要求处理器设计,要提供面向最终用户和应用程序的解决方案。物联网应用的芯片设计强调功率效率,随工业级人工智能技术的应用,越来产生越多的数字平台,而下一代工业数字平台的演进,就是让工业设施可以在不同的网络环境下运转,对各类主板芯片的需求随之增加,研发集成效果是否优异、软件支撑平台是否便利,就成为考量一款嵌入式处理器解决方案性能的主要因素。
    同时,嵌入式人工智能技术正在解决物联网设备所面临几个“痛点”问题,包括高延迟和低响应、网络安全、数据隐私问题等。以数据隐私为例,物联网设备在服务用户或企业时,会产生大量的运行数据,其中会包含一些隐私、机密信息,一旦隐私数据泄漏就将给企业、用户带来不同程度的损失。比如家庭物联网中的摄像头、扫地机器人在自动运行中产生的图片、视频泄露等,使用户饱受损失。而嵌入式人工智能技术可以让设备在非联网的情况下独立运行,一定程度上保证了数据的隐私性,另外随着智能联网设备的普及,集成智能设备的硬件终端也将随之出现,可以保证数据的“物理隔离”。
    嵌入式人工智能也被称作为边缘计算技术。首先,智能终端并不是完全需要在云平台上进行,会给通信传输带来较大压力,同时未来解决数据延迟和安全性等问题,边缘计算逐渐开始被应用。今年华为发布了“昇腾910”AI芯片和“麒麟990”5G芯片,其中“昇腾910”是目前单芯片计算密度最大的芯片,计算力远超国际同类产品。华为表示,将向全球开发者公布其技术参数,共同打造AI生态,推动AI产业落地。
    小结:在嵌入式人工智能技术领域,数据洞察主要体现在对产品或技术的补足方面,让物联网终端设备具备独立处理数据的能力。
    浮层互动技术(Embedded interaction)
    在视频领域内,与浮层互动技术相对应的还有嵌入式互动技术,和嵌入式人工智能的技术实现上有较大差距。奈飞(Netflix)推出的《黑镜:潘达斯奈基》(下文称《黑镜》)互动视频,就属于嵌入式互动技术。即,观众可以通过“互动点”自由选择剧情走向。而《黑镜》90分钟的视频时长中包含312个视频素材和5个不同的结局。通常对视频内容层面的互动,被归纳为嵌入式互动,通常视频内容和互动工具在视频制作过程中就嵌入到视频格式之中,通过技术处理改变观看体验。
    
    在生活服务、娱乐APP方面,抖音的“以视频搜视频”、快手的“AI宠物”、AI视频广告都属于浮层式互动技术。我们通常把“弹幕”归类为浮层互动技术的初级功能,通常浮层互动技术与视频内容(视频编辑)没有必然关联性。就像“AI宠物”只是一个具备娱乐、工具属性的功能,辅助视频直播、优化用户体验,但没有“AI宠物”也并不影响直播的进行。弹幕、云图广告、AI宠物等,这些只是轻度的互动功能,更加深入的互动,需要视频小程序来实现。极链科技以自研 VideoAI、VideoOS 为底层操作系统,专注消费级视频AI技术研发和商业应用,并持续投入小程序开发者生态的构建。
    浮层互动技术的底层原理是“AI视频识别”,即在不影响视频播放的前提下,对视频内容的结构化处理。以人工智能技术为底层引擎的视联网服务将会给浮层互动带来更全面的应用场景,给视频产业带来新的增长点。在以下三个方面,视联网的人工智能引擎得到了大幅的进步,初步具备了支撑一个产业的能力。
    一是对视频内容信息的理解更加全面,即视频标注维度越来越丰富。过去,在人工智能识别方面只有面部识别满足商业化标准,但随着近些年算力、算法、数据的的优化、积累,人工智能已经可以识别视频中的人脸、物体、场景、品牌、动作、表情、事件、地标等多个类别和不同标签维度。并且算力成本逐渐降低,使得浮层互动可以给视频带来更多的商业化应用。
    二是对知识图谱的构建更加完善,即数据的整理分类更具人脑思维逻辑。人们对视频结构化数据的理解更深入,推动了知识图谱的价值体现。一方面,知识图谱的丰富性可以推动AI识别效率的提升,基于信息间的相互关联性,可以减少识别所需的训练样本。另一方面,知识图谱的完善有利于视频商业价值的挖掘,例如在AI广告方面除了选择较好的广告点位之外,还可以通过文字、表情、音乐等方面排除负面场景,从而提高广告的投放质量。
    三是逐渐具备构建数据业务中台的能力,包括服务视频平台、小程序开发平台、广告主操作平台等多种数据业务中台。比如计算资源优先级处理和数据资源管理,以及数据调度等,让视频平台方可以清晰且实时掌控视频数据表现的综合图谱等。
    浮层互动技术的应用,不仅要依托视频内容数据,还需要深入理解消费者的视频观看习惯,从潜在需求出发满足用户需求,优化小程序及其他相关功能的调用方式,以达到视频内容价值放大的效果。
    随着AI技术应用越来越广泛,各种产业数据以“倍数”形式增长。大多数企业已经意识到了数据中所隐藏的价值,但是还不具备挖掘数据价值的能力,所以导致了当前企业会花大的代价存储数据,而无法标注数据让其产生价值的尴尬局面。因此,数据价值的洞察仍是未来人工智能领域发展的内核。