智行千里,“人文”为本:可视化文本分析将引领人工智能3.0时代


    2020年第二季度的Forrester Wave分析报告中,SAS被评为基于AI的文本分析领域领导者。
    2020年7月20日,中国北京 — 近日,全球领先的独立研究机构Forrester发布2020年第二季度的Forrester Wave分析报告。与往年有所不同,今年的报告首次将“基于人工智能的文本分析平台”的分析主题分为“文档数据”和“个人数据”两大方向。而作为全球数字分析领域的领导者,SAS凭借多年以来在文本分析上的技术深耕以及人工智能上的创新成果,同时被Forrester Wave分析报告评为基于人工智能的“文档数据”和“个人数据”文本分析双领域的领导者。
    

    
    

    
    

    众所周知,大部分的商业相关信息都是以非结构化格式(主要是文本数据)而存在的,但是由于近年来数据的爆发式激增,不仅使本来非结构化的数据被进一步沉积,也让数据质量更加糅杂。倒逼之下,越来越多的企业竭力寻找更高效、更智能的工具来获得快速增长的数据并从中挖掘出可实现的价值。但是,一些错综复杂的因素(比如:价格、专家评定、学习过程、时间)成为企业寻找“得手”工具的阻碍。可视化文本分析平台的出现,能帮助企业摆脱这种“进退两难”的境地,并让收集信息比以前更加简单。可视化文本分析平台让每一个人都能够在数据驱动基础上增加决策程序,同时这个平台也可成为一些综合商业智能计划的重要成分。
    “对于不同的行业领域,任何企业和机构都可从海量的非结构化数据中挖掘出深刻洞察和巨大商业价值”。SAS公司高级产品市场经理Katie Tedrow表示:“文本分析确实可以帮助企业机构解决复杂的业务问题,例如侦测欺诈行为、评估客户反馈等,但是传统的分析流程更倾向于劳动密集型,更依赖手动操作且需要更多的人力投入。SAS可视化文本分析(SAS Visual Text Analytics)则通过自然语言处理(NLP)、机器学习和语言规则等强大功能,帮助商业用户轻松挖掘非结构化数据背后隐藏的价值,制定商业决策并提升用户体验。”
    以“人文”为本,透视非结构化数据中蕴藏的金矿
    针对结构化数据的可视化在许多公司中成为最优也是最便捷的文本分析方式。但是无法回避的是,许多企业仍然被淹没在巨大的数据量以及文本数据源快速增长的洪流当中。因此许多的数据都夹杂了大量的非结构化数据。
    文本数据一直存在且随处可见。这些数据可以在你公司内部的邮件信息、聊天记录以及搜集到的调查结果中得到,也可以是你对个人网站上的评论、对客户关系管理系统中的评论或者是从你使用的个人应用程序中得到的文本字段。甚至是你在公司外部的社会媒体、论坛以及来自于一些你很感兴趣的话题的评论。因此,这些文本数据零散且冗杂,对于企业而言针对这些非结构化数据进行文本分析有些“入不敷出”。所以有些企业现在正投资几十亿美金分析结构化数据,却对非结构化数据置之不理。
    熟不知,无论是各类文档数据,还是能够描绘用户画像的个人数据,在这些非结构化数据中都蕴藏着有用的信息宝库,利用数据可视化工具分析非结构化数据能够帮助企业快速地了解现状、显示趋势并且识别新出现的问题。在Forrester Wave基于人工智能的文档数据和个人数据文本分析平台两大分析报告中,SAS可视化文本分析秉持“人文为本”的研发和优化策略,在诸多子类别评选中均获得了最高分,包括:子文档分析、机器学习能力、架构、安全性、产品支持及服务、全球市场表现等。
    两份报告都指出:“SAS可视化文本分析进一步完善了自身强大的分析产品和解决方案组合,它主要基于SAS Viya 平台,不仅能够实现不同应用场景之间的数据共享和模型管理,更辅以杰出的商业智能、便捷的分析图形用户界面和其他微服务架构,为企业和用户提供绝佳的用户体验。”
    让机器决策,赋能文本分析引领人工智能3.0时代
    事实上,“人工智能”正式提出时,计算机国际象棋和机器翻译就是人工智能的两个标志性目标,但直到国际象棋甚至围棋都被人工智能所攻克,机器认知智能的核心能力之一,即自然语言处理(NLP)能力依然无法和人类相比。
    NLP大致包含三个技术层面:词法分析、句法分析、语义分析,三者之间既递进又相互包含,这也构成了NLP技术的最大瓶颈。由于词句往往在具体的场景下拥有不同的涵义,人在理解时会基于已有知识储备和上下文环境,然而人工智能目前还很难做到。要让机器理解我们人类的语言,机器必需共享与我们类似的背景知识,还需要依赖深度学习技术,这也就需要大规模甚至超大规模的数据积累,让机器不断训练和学习。
    SAS公司副总裁兼大中华区董事总经理何伟信表示:“回首人工智能发展的60多年,我们经历了“算法为重”的1.0阶段,现在则进入“数据凸显”的2.0阶段,但真正步入“让机器做明智决策”的3.0阶段,还需要大量数据积累和技术的提升。因此,实现认知智能不仅是当前人工智能领域发展的重要使命,更是SAS未来几年不断探索追求的终极目标。”
    SAS可视化文本分析就融合了智能算法、NLP、机器学习等创新技术,自动抽取非结构化数据中的关系和模式,从而使手动分析成为历史。NLP工具可帮助用户进行情感分析,将语音转化为文本,理解自然语言并生成自然语言。例如,通过NLP访问和分析未挖掘的数据,使金融机构能够提高反洗钱(AML)调查的管理效率和精准度。采用自动化分析后,调查人员可以使用统一的风险识别手段来应对负面新闻监测、交易单据违规监控等繁杂的业务场景。这使得用户能够了解各个事件的风险级别,然后优先调查风险最大的事件。
    以“知的力量”,让智能分析服务人类社会健康发展
    一直以来,SAS都秉持“知的力量”,对其简单易用且功能强大的自动化分析平台进行完善和升级,以帮助数字颠覆者和新兴领导者开辟前进的道路。最新版的SAS Viya  、SAS平台、SAS可视化文本分析等均加入人工智能相关的创新技术,尤其在机器学习、计算机视觉、NLP以及其它支持人工智能的技术领域大举发力。
    特别是SAS近年来宣布将投资10亿美元用于人工智能,在此基础上SAS还将改进计算机视觉软件,以帮助企业利用可视化数据来改善业务成果。“我们一直不断推行‘知的力量’并强调智能创新,这一点清晰地体现在SAS平台和SAS人工智能技术中。创新推动着领先的公司、管理人员和数据科学家通过应用高级分析来改变其公司、行业的发展轨迹,甚至为人类社会谋福祉”。SAS首席执行官Jim Goodnight表示。
    因此,正值疫情期间,SAS还发布了COVID-19科学文献搜索与文本分析平台,该平台为研究人员提供了免费的可视化文本分析环境,凭借强大的人工智能和机器学习技术,让相关人员能够从数以万计的研究文献中检索最需要的文本内容,不仅让研究人员能够更快、更精准地找到潜在的解决方案,同时也为疫情防控做出贡献。