AWS 推出五项机器学习新服务

2024.05.07 美通社

    Amazon Kendra 重塑企业搜索，它利用自然语言处理及其它机器学习技术，将企业内部的多个数据孤岛统一起来，始终如一地为常见查询提供高质量的结果，而不是以随机的链接列表响应关键字查询
    Amazon CodeGuru可帮助软件开发者自动执行代码审核，确定应用中开销最大的代码行
    Amazon Fraud Detector基于为Amazon．com开发的相同技术，帮助企业实时识别线上身份欺诈和支付欺诈
    Amazon Transcribe Medical为医疗保健提供商提供高精度的、实时语音到文本转录，以便他们可以专注于患者护理
    Amazon Augmented Artificial Intelligence （A2I）帮助机器学习开发者通过人工确认验证机器学习预测
    美国西雅图2019年12月4日／美通社／－－北京时间2019年12月3日，在 AWS re：Invent全球大会上，亚马逊（NASDAQ：AMZN）旗下公司Amazon Web Services， Inc．（AWS）宣布五项新的人工智能（AI）服务，旨在将机器学习交到更多应用程序开发者和终端用户手中，而他们无需机器学习经验。AWS介绍了几项使用了 AI 的新服务，让更多开发者应用机器学习，创造更好的终端用户体验，包括机器学习驱动的企业搜索、代码审核与分析、欺诈检测、医疗转录和 AI 预测的人工审核。
    机器学习持续快速增长，如今有数以万计的客户在 AWS 上进行机器学习，包括许多选择使用 AWS 完全托管的 AI 服务的客户，例如，Alfresco、拜耳作物科学、Cerner、CJ考克斯汽车、C－SPAN、德勤、多米诺、阿联酋航空NBD、弗雷德哈钦森癌症研究中心、 FICO、FINRA、盖洛普、Kelley Blue Book、起亚、Mainichi报业公司、美国宇航局、普华永道、白宫历史协会、雅马哈公司和Zola。在过去一年里，AWS 推出了多个完全托管的 AI 新服务，如 Amazon Personalize和Amazon Forecast，让客户能够受益于亚马逊消费者业务使用的、使其客户体验屡获殊荣的、相同的机器学习个性化推荐和预测技术。AWS 客户有兴趣学习亚马逊大规模使用机器学习的丰富经验，以改进运营，提供更好的客户体验，又无需训练、优化和部署自己的定制化机器学习模型。如今，AWS 宣布推出五项新的 AI 服务，这些服务基于 Amazon 丰富的机器学习经验，允许所有行业、所有规模的机构在其企业中采用机器学习，而无需机器学习经验。
    Amazon Kendra通过机器学习重塑企业搜索
    尽管多年来多种尝试，但内部搜索对于当今的企业来说仍是一个棘手的问题，大多数员工仍然经常难以找到他们需要的信息。机构拥有大量非结构化文本数据，如果能够发现、存储多种格式并跨不同的数据源（例如 Sharepoint、Intranet、Amazon S3 和本地文件存储系统），则这些数据非常有用。即使通用的、基于 Web 的搜索工具随处可见，机构仍然发现内部搜索很困难，因为没有可用工具能够很好地跨越现有数据孤岛编制索引，无法提供自然语言查询，并且无法提供准确的结果。当员工有疑问时，他们需要使用可能出现在不同上下文、多个文档中的关键字，这些搜索通常会生成一长串随机链接，员工必须筛选这些链接才能找到他们查找的信息（如果他们找得到的话）。
    Amazon Kendra 让员工可以使用真实问题（而不仅仅是关键字）在多个数据孤岛中搜索，在后台部署 AI 技术来提供他们寻求的精确答案（而不是随机的链接列表），重塑企业搜索。员工可以使用自然语言运行搜索（关键字仍然有效，但大多数用户更喜欢自然语言搜索）。例如，员工可以提出一个特定问题，如“IT 服务台什么时候开？”Amazon Kendra 会给他们一个具体答案，如“IT 服务台在上午 9：30 打开”，同时给出指向 IT 门户和其它相关网站的链接。客户可以在应用程序、门户和 wiki 中使用 Amazon Kendra。只需在 AWS 管理控制台中单击几下，客户即可将 Amazon Kendra 指向其各种文档存储库，服务会聚合 PB级的数据以构建集中索引。Amazon Kendra会扫描文档的权限，确保搜索结果符合现有的文档访问策略，搜索结果仅包含用户有权访问的文档。此外，Amazon Kendra还根据客户的特定情况，积极地重新训练机器学习模型，使用点击率数据、用户位置和反馈提高准确性，随着时间的推移提供越来越好的答案。
    Amazon CodeGuru 使用机器学习提供自动代码审核，帮助机构找到开销最大的代码行，从而改进软件开发
    跟亚马逊一样，AWS客户也编写了大量代码。软件开发是一个广为人知的过程。开发者编写代码、查看代码、编译代码和部署应用程序、衡量应用程序的性能并使用该数据改进代码，循环往复。然而，如果代码一开始就不正确，那么所有这些过程都没什么用，所以团队都会在新代码添加到现有应用程序代码库之前执行代码检查，检查逻辑、语法和样式。即使对于像亚马逊这样的大型机构，考虑其每天要编写的代码量，也很难有那么多有经验的开发者、他们有足够的富余时间来审核代码。而且即使是有经验的审阅者遇到面向客户的应用程序时也会漏掉问题，从而导致出错和性能问题。
    Amazon CodeGuru 是一种新的机器学习服务，可自动执行代码审核，找到应用程序开销最大的代码行。Amazon CodeGuru 有两个组件：代码审核和应用程序分析。对于代码审核，开发者像往常一样提交其代码（目前支持GitHub 和 CodeCommit，未来会支持更多的存储库），将 Amazon CodeGuru 添加为代码审阅者之一，无需对正常过程或要安装的软件进行其他更改。Amazon CodeGuru 收到拉取请求，会自动开始使用经过预先训练的模型来评估代码。这些模型已经在亚马逊和GitHub前10000的项目中经受过数十年的代码审核训练。Amazon CodeGuru将检查代码更改的质量，如果发现问题，它将向拉取请求添加易于阅读的注释，标识出代码行、特定问题和修正建议，包括示例代码和指向相关文档的链接。
    Amazon CodeGuru 还包含一个机器学习驱动的应用程序探查器，可帮助客户找到开销最大的代码行。要使用它，客户只要在其应用程序中安装一个小小的代理程序，然后 Amazon CodeGuru 就可以观察应用程序运行时，每五分钟分析一次应用程序代码。代码配置文件包括有关延迟和 CPU 利用率的详细信息，直接链接到特定的代码行。Amazon CodeGuru可帮助操作者在应用程序中找到开销最大的代码行，生成火焰图，帮助直观地标识出造成性能瓶颈的其它代码行。多年来，亚马逊内部团队使用 Amazon CodeGuru 对 80000多个应用程序进行了代码分析。2017 到 2018 年，Amazon CodeGuru内部版本的广泛使用，帮助亚马逊消费者业务的 Amazon Prime Day 团队提高了其应用效率，CPU 利用率提高325％，减少了管理 Prime Day 所需的实例数量，整体成本降低了39％。
    Amazon Fraud Detector使用机器学习进行自动欺诈检测
    世界各地的机构每年因欺诈而损失数百亿美元。如今，许多 AWS 客户都投资于大型、昂贵的欺诈管理系统。这些系统通常基于手工编码的规则，耗时、定制成本高，很难随着欺诈模式的变化而保持最新，导致系统的准确性低于预期。这导致机构将优秀客户拒绝为欺诈者，进行更昂贵的欺诈审核，错失降低欺诈率的机会。20 多年来，亚马逊一直在使用包括机器学习在内的尖端技术来检测欺诈易，并了解这是一个与欺诈者不断进行的猫捉老鼠游戏，需要大量的资源来构建防御、保持与时俱进。AWS的客户们希望 AWS可以分享其专业知识和经验。
    Amazon Fraud Detector提供完全托管的服务，基于亚马逊消费者业务使用的相同技术，实时检测潜在的线上身份欺诈和支付欺诈，无需机器学习经验。Amazon Fraud Detector使用欺诈和合法交易的历史数据来构建、训练和部署机器学习模型，提供实时、低延迟的欺诈风险预测。首先，客户将交易数据上传到 Amazon S3，定制模型训练。客户只需提供与交易关联的电子邮件地址和 IP 地址，可以选择添加其它数据（例如帐单地址或电话号码）。根据客户想要预测的欺诈类型（新帐户或线上支付欺诈），Amazon Fraud Detector将预处理数据、选择一个算法、训练一个模型－－使用亚马逊数十年来大规模运行欺诈检测风险分析的经验。Amazon Fraud Detector还使用基于机器学习的、根据亚马逊数据训练过的数据检测器。这些数据检测器可帮助识别与发生在Amazon上的欺诈活动（例如异常的电子邮件命名规律）相似的模式，即使客户向Amazon Fraud Detector提供的欺诈示例数量很少，也可以帮助提高模型训练的准确性。
    Amazon Fraud Detector将模型训练、部署到完全托管的私有API 端点。客户可以将新活动（例如注册或新购买）发送到 API、接收包括风险评分的欺诈报告。根据此报告，应用程序可以确定正确的行动（例如接受购买，或将其传递给人工审核）。借助 Amazon Fraud Detector，客户可以更快、更轻松地、更准确地检测欺诈。
    Amazon Transcribe Medical使用机器学习转录医疗语音，让医疗保健提供商能够专注于患者护理
    如今，医生们的一部分日常工作，是将详细的数据输入病历（EHR）系统。然而，帮助他们准确记录和存档病情的解决方案是欠佳的。在许多医院，医生必须将医疗笔记口述到记录器中，然后将这些语音文件提交到第三方手动抄录，服务成本高昂，可能需要长达三个工作日，延误了存档流程。另一种选择是利用现有的前端听写软件，但受限于现有的工具，医生们仍然每天要在临床记录上花费好几小时。第三种选择是医疗保健提供商雇用人工抄写员，在医生们看病时协助做记录，但人工抄写员可能会令患者感到不安，医生们经常提到他们的记录有欠缺，医疗机构也很难大规模地安排和协调抄写员。总之，现有的解决方案在提高临床记录效率和改善患者护理方面都有不足。
    Amazon Transcribe Medical通过使用机器学习技术自动转录自然医学语音来解决这些问题。建立在 Amazon Transcribe Medical语音到文本功能之上的病历应用，可以准确、经济实惠地生成记录。Amazon Transcribe Medical由多个机器学习模型组成，这些模型经过数万小时的医学语音训练，可提供准确的、机器学习驱动的医学转录。实时生成记录，消除了多日的流转时间。
    Amazon Transcribe Medical可以帮助医生们在跟患者沟通时自动转录对话，不用分心手动笔记，医疗保健提供商能够专注于患者护理。医生可以自然地说话，Amazon Transcribe Medical使用内置的自动标点符号，克服现有转录软件的局限性。对于医疗保健提供商，基于 Amazon Transcribe Medical的语音解决方案可扩展到数千个潜在的医疗中心，消除了管理和协调临时抄写员的操作难题。Amazon Transcribe Medical符合 HIPAA 认证，提供易于使用的 API，可与支持语音的应用程序和带有麦克风的任何设备集成。Amazon Transcribe Medical的输出文本也可以用于其他 AWS 服务，例如自然语言处理服务 Amazon Comprehend Medical，在最终进入病历系统前进行下一步的数据分析。
    Amazon Augmented Artificial Intelligence （A2I）允许开发者使用人工审阅验证机器学习预测
    机器学习可以为各种应用场景提供高度准确的预测，包括识别图像中的对象、从扫描的文档中提取文本、或者转录与理解口语。在每种情况下，机器学习模型都会提供预测，提供置信度分数以表示模型预测的确定性。置信度分数越高，结果的可信度就越高。对于许多应用场景，当开发者收到高置信度结果时，他们可以信任其结果可能是准确的，可以自动处理它们（例如，自动调整社交网络上用户生成的内容，或者给视频加字幕）。但是，在置信度低于预期的情况下，预测结果模糊，可能需要人工审核才能解决这种模糊性。机器学习和人工审阅之间的这种相互作用，对于机器学习系统的成功至关重要，但人工审核的大规模构建和运营，很有挑战，成本高昂，通常涉及多个流程步骤，需要定制软件管理人工审核任务和结果，需要招聘和管理大量审核人员。结果，开发者时常花费大量的时间来管理人工审核过程，而不是构建其预想的应用程序，或者不得不放弃人工审核，导致许多预测的信心和效用都很低。
    Amazon Augmented Artificial Intelligence （A2I）是一项新服务，使用它很容易构建和管理机器学习应用程序的人工审核。Amazon A2I 为常见的机器学习任务－－例如图像中的对象检测、语音转录和内容审核－－提供预构建的人工审核工作流，方便对来自 Amazon Rekognition 和 Amazon Textract 的机器学习预测做人工审核。开发者为其特定应用程序选择置信阈值，所有置信度分数低于阈值的预测都将自动发送给人工审核人员进行验证。开发者可以选择Amazon Mechanical Turk的 50万全球人工、预授权人工的第三方机构如Startek、iVision、CapeStart、Cogito 和 iMerit、或他们自己的审核人员执行其审核。审核结果存储在 Amazon S3 中，开发者在审核完成后会收到通知，以便他们根据审核人员的可信结果进行下一步操作。Amazon A2I 为所有开发者带来了人工审核，消除了构建和管理定制审核流程或招募大量审核人员方面的繁重工作。
    亚马逊机器学习副总裁 Swami Sivasubramanian表示，“各个行业领域的公司都告诉我们，他们希望利用亚马逊丰富的机器学习经验，应对企业面临的一些共同挑战。这些挑战包括内部搜索、帮助软件开发者编写更好的代码、识别欺诈易、以及提高所有机器学习系统的整体质量。亚马逊还凭借数十年来构建机器学习系统的经验，打造了能够成功应对这些挑战的内部系统。今天的发布是我们客户至尚文化的又一次迭代，是它激励我们开发这些系统。通过这些发布，我们很高兴能够让企业用户使用这些机器学习功能，而无需任何机器学习专业知识。”
    3M 是一家跨国公司，是研磨产品、化学品与先进材料、薄膜、过滤、粘合剂等产品的领先制造商之一。3M以协作的方式应用科技改善生活。3M企业研究系统实验室技术总监David Frazee表示，“研发是3M的心跳，扎根科学让我们强大。我们的材料科学家开展新的研究时，他们需要了解过去的、可能相关的研究。这些信息往往埋藏在我们的专利和广泛的知识存储库中。寻找合适的信息往往让人精疲力竭，耗时，有时信息不完整。借助Amazon Kendra，我们的科学家可以使用自然语言查询、快速准确地找到所需的信息。借助Amazon Kendra，我们的工程师和研究人员热情高涨，快速查找信息，加快创新速度，更有效地协作，源源不断地为客户提供独特的产品。”
    Workgrid 软件公司是 Liberty Mutual（利宝保险）的全资子公司，为员工体验平台中提供软件解决方案，让工作更加互联、更高效、生产力更高。“我们的核心产品之一是 Workgrid Chatbot，它让员工能够快速获得频繁查询的答案，使用友好的自然语言界面自动执行任务。企业聊天机器人的一个关键部分是回答来自员工的无数问题，所以 Workgrid 提供自助问答构建器，内容作者不用掌握编程语言，就可以训练聊天机器人响应员工的问题。除了这些精心策划的内容外，我们希望为 Workgrid Chatbot 提供一种方法，以便从整个企业的大量文档（例如 PDF 文档）轻松提取知识，”Workgrid 云工程和 AI 主管 Gillian McCann 说，“借助 Amazon Kendra，很高兴我们的客户能够快速高效地获得所需的答案。Amazon Kendra 能够直接从多个存储库的非结构化数据中提取答案，并且有可能快速跟踪学习，让我们向客户交付准确、不断优化的答案。我们很高兴能探索 Amazon Kendra 联系上下文的智能搜索和任务自动化的结合，让我们可提供强大的员工体验。”
    英国广播公司是广播业的世界领导者之一。他们把BBC的影像和声音带到世界各地。“作为一家全球性媒体机构，我们管理数 PB 的视频，每天24小时做直播，”BBC 首席技术和产品官 Matthew Postgate 说，“Amazon CodeGuru 以及我们的团队使用的其它开发工具，有助于确保我们不断为受众提供强大、可靠的服务，在问题出现之前发现问题。它还将帮助我们深入了解我们的服务如何与 AWS 平台交互，使团队能够重构和优化其代码，为人们提供他们期望从 BBC 获得的服务。”
    Apptio SaaS 解决方案可帮助机构在分析、规划和优化投资时做出明智的决策，转变IT运营模式。Apptio 首席产品官 Scott Chancellor 表示：“为客户提供高度可用的无 Bug 服务对于我们的成功至关重要。我们一直在寻找工具变革我们的组织，更主动地检测应用开发周期各个阶段的问题，提高开发速度，少花时间在解决并发、资源泄漏和性能瓶颈等疑难问题上。我们尝试了 Amazon CodeGuru，发现它可以提供在开发的早期阶段主动解决这些问题的建议。此外，它可以指出降低服务速度的代码区域，我们可以少花时间解决性能相关的缺陷。这些改进将帮助我们为所有客户提供更好的体验。”
    SmugMug＋Flickr 是世界上最具影响力的、以摄影师为中心的平台之一。“Smugmug ＆ Flickr专为专业摄影师和摄影爱好者打造，展示他们的作品，也供他们欣赏他人作品。从第一天起，SmugMug 的激情就是，不断想办法让摄影师讲述他们想讲述的故事，以他们想要的方式讲述故事。当我们大规模运营时，图像处理、分类和搜索的性能成为重中之重，”SmugMug＆Flickr首席执行官兼首席极客Don MacAskill 说，“Amazon CodeGuru 的实时分析有助于排除故障，识别我们服务的低效部分，尤其是应用程序中有价值的代码行会减慢它们的速度。它提出建议、协助我们更改和优化。根据 CodeGuru 的建议，我们能够重新构建代码，使其高度可维护，提高我们的服务性能。”
    Charles Schwab是一家先进的投资服务公司。“线上检测欺诈活动是一项永无止境的挑战，不良行为人不断制造着新的攻击媒介。我们的使命是走在坏人的前面，保护我们的客户，”Charles Schwab欺诈监控与调查副总裁 Kara H． Suro 说：“我们对Amazon Fraud Detector的推出感到兴奋。这让我们可以更快、更轻松地构建机器学习工具，发现欺诈活动；我们预计欺诈预防率会显著提高。部署Amazon Fraud Detector，将有助于从我们的历史数据中识别欺诈模式，也可以利用亚马逊检测欺诈的经验。”
    Vacasa是北美最大的全方位服务度假租赁管理公司之一，在 17 个国家／地区拥有超过 23000 家度假屋，每年为超过 200万客人提供服务。Vacasa 创始人兼首席执行官 Eric Breon 表示：“自公司成立以来，我们利用技术使当地团队能够专注于照顾家庭和客人，同时为度假房主实现收入最大化。我们对Amazon Fraud Detector的发布感到兴奋，这意味着我们可以更轻松地使用先进的机器学习技术，准确检测欺诈性预订。保护我们的‘门户’免受潜在伤害，使我们能够专注于使度假租赁体验无缝、无忧。”
    Cerner是卫生信息技术解决方案、服务和设备的领先提供商之一。Cerner公司解决方案策略师Jacob Geers 说：“临床文档的精确性对于工作流程和总体的护理人员满意度至关重要。通过利用 Amazon Transcribe Medical的转录API，Cerner正在初步开发数字语音抄写器，自动收听医生与患者的互动，毫不显眼地以文本形式捕获对话。然后，我们的解决方案能够智能地翻译概念，进入Cerner病历系统中的编纂组件。”
    Suki 是一款 AI驱动、支持语音的数字助理，可减轻医生的事务负担。Suki AI公司首席执行官 Punit Soni 说：“临床文档事关医疗数据工作流程，帮助临床医生更有效地采集笔记是关键。我们可以轻松地将我们的临床数字助理与Amazon Transcribe Medical集成，允许医生口述医疗笔记，将临床文档的精力消耗平均降低 76％。他们的时间应该花在照顾病人上，而不是做数据输入工作。”
    作为美国的Un－carrier （去运营商化的运营商），T－Mobile美国公司通过领先的产品和服务创新，正在重新定义消费者和企业购买无线服务的方式。“在T－Mobile，我们以客户的幸福来衡量成功。作为Un－carrier，我们知道，当客户觉得我们了解并预测到他们的需求、直接解决他们的痛点时，他们会感到最幸福，”T－Mobile执行副总裁、首席信息Cody Sanford说，“我们的专家团队客户服务模式致力于建立个人联系，并使用 A2I 等尖端工具为我们的团队取得成功做好准备。是的，机器学习带来更深入、更投入的关系！访问实时的上下文信息，例如如客户详细信息和可用折扣，使我们的团队能够在与客户进行真实、实时的对话时，代表客户做出现场决策……完全双赢！”
    VidMob 是一个营销创意平台，可为品牌的所有创意需求提供端到端技术解决方案。其集成平台将同类首创（first－of－a－kind）的创意分析与一流的创意制作相结合，提高营销效率。“Vidmob 利用机器学习来分析视频的各个方面，包括人物、对象和信息，帮助品牌了解创意绩效，构建更好的创意。然而，对于现有机器学习模型未涵盖的维度，要从我们每天分析的 PB 级数据中回顾创意，很有挑战性，”VidMob 数据和见解高级副总裁Joline McGoldrick说，“凭借我们目前训练有素的创意评估队伍，使用 A2I，我们可以更快地优化、微调我们的预测模型。这种效率使我们接触到大量审核人员，将模型上市速度提高了 3 倍。”