数据中心中的人工智能:你要了解的七件事
人工智能和机器学习正在逐步接管日常任务和高级任务。管理者和员工会被扫地出门吗?
大多数IT领导者都认为自己完全掌握了数据中心的管理、运营和规划。实际上,他们没并没有掌握。
没有一个IT领导者或IT专家团队能对数据中心的重要任务施加精确(甚至更精细)的控制——精确到每一秒。人类(即使是受过高等教育和训练的人)也往往会受个人喜好、偏见和误解蒙蔽,无法对未来的规划和其它重要职责形成清晰的看法。
人工智能(AI)就没有这样的缺点。这就是为什么,即使当数据中心运营商为混合环境、物联网和其它难题时而烦恼时,他们也需要考虑人工智能对一大群关键的数据中心运营和服务所产生的影响。
以下是所有IT领导者需要了解的七件事,这些事情关系到人工智能如何将数据中心变成更强大,更高效的设施。
1. 许多不同类型的数据中心可以从人工智能中受益
Joe Merces(他是企业备份和灾难恢复技术提供商Cloud Daddy的首席执行官和纽约市法务部的前首席信息官)说,所有类型的数据中心都可以从人工智能中受益,但受益最大的数据中心往往是大型设施,如大型企业数据中心、公共云数据中心、托管主机的数据中心和外包数据中心。
电气和电子工程师协会(IEEE)的研究员兼数据存储分析公司Coughlin Associates的总裁Tom Coughlin认为,所有的数据中心都可以利用机器学习等人工智能方法来更好地管理内部资源,并预测即将推出的硬件和数据需求。他指出:“人工智能正在成为最重要的(数据中心)应用程序之一。”
数据中心维护服务提供商Park Place Technologies的创新负责人Paul Mercina解释说,机器学习正在从基本的模式识别和传统算法转变为更复杂的深度学习领域。他说:“机器学习的一个关键贡献是,它能够使用迭代的方法发现数据中的结构,而无需人类从任何理论或假设开始进行测试”。深度学习使用多层人工神经网络,在对象检测和分类、语音识别和语言翻译等任务中带来极高的准确度。
2. 人工智能帮数据中心提高能效
在过去几年中,人工智能工具在减少数据中心能耗和浪费方面发挥着越来越重要的作用。Mercina指出:“这些应用程序有助于降低功耗,对低下的冷却效率发出报告并分析关键任务系统的健康状况,以提高效率并节约能源。”
荷兰数据中心协会的常务董事Stijn Grove说:“数据中心的环境不断发生变化”。他认为,人工智可以监督当前室内外的温度并预测未来的天气,这使数据中心能够优化制冷资源并节约能源。
服务器是所有数据中心的用电大户。Grove说:“当你想在需要的时候自动扩展或缩小云服务器的规模时,只要充分利用每台服务器的潜力并关闭未使用的容量,你就能节约更多的能源。”
人工智能还可以显著减少存储能耗。只要用人工智能的监控和分析来预测各类用户的活动,数据中心就可以快速将不太常用的数据转移到能耗较低的存储源,并将频繁使用的数据转移到能性能更好的存储源。Coughlin说:“此外,使用人工智能来最大限度地减少处理过程中来回移动的数据是可能做到的”。他解释说:“使用中的数据可以进行智能布局,这可以使数据和处理数据的地方挨得更近,从而减少过度数据移动所消耗的能量。”
3. 人工智能可以提高数据中心的安全性
数据中心的安全需求正在迅速发生变化。直到最近,数据中心面临的最大威胁依然来自内部的员工或来自外部的相对原始的暴力攻击。卡内基梅隆大学泰珀商学院的商业技术副教授Param Vir Singh表示:“如今,黑客正在创建基于人工智能的算法,这些算法试图发现数据中心的弱点”。他指出,人工智能是应对这一挑战的最佳技术。
Mercina说:“人工智能应用程序使数据中心能够更快地适应不断变化的安全要求,同时为用户提供更安全的环境,而无需强制执行严格的规则。人工智能解决方案还有助于检测恶意软件和垃圾邮件,分析正常和异常的活动模式,发现弱点并加强对潜在威胁的保护。”
Coughlin说,人工智能还可以将恶意入侵隔离在‘蜜罐’中,“在这里,人们可以对其进行密切监控,甚至可以追踪入侵者。”
4. 人工智能可以优化数据中心的性能
只要不断监控和调整包括处理数据的地方、网络和内存在内的资源,人工智能就可以使企业以最高的效率运行数据中心。Merces指出:“人工智能可用来监控负载分配,使基础架构更具可扩展性,同时优化冷却和功耗方面的效率”。人工智能还可用来优化服务器的配置和利用率。他说:“例如,只要移动负载并通过重启、循环启动和重新制作镜像的方法来尝试修复,人工智能就可以发现基础设施的问题并进行自我修复。”
Coughlin认为,人工智能特别有效地优化服务器的使用。他说:“这可能包括将合适的处理能力交给应用程序所特有的处理器,例如GPU和TPU”。人工智能还可以优化数据中心软件的性能。他补充说“例如,限制数据库中相同数据的轮询或限制重复过程。”
5. 人工智能将改善基础设施管理
Ponemon Institute的一项研究称,2016年各行业数据中心停机时间的平均成本约为每分钟8,850美元。Singh说:“如果我们能够预测维护方面的问题,我们就可以采取预防措施。”
只要使用不断改进的基础设施管理技术和智能传感器,人们就可以训练神经网络来分析现有基础设施的需求和容量,以便利用最合适的设备来满足需求。律师事务所Tucker Ellis的合伙人Tuck Northman说(他专于商业法和企业法):“因为,相比于一个人或一群人,人工智能能处理更多的信息,而且几乎是即时处理的,所以人工智能导向的系统更有效,更可靠”。他指出,传感器还有助于数据中心的管理者预测或减轻灾难性故障。
Mercina指出,如今,大多数数据中心都由训练有素,执行日常任务(如遍历数据中心行,搜索表明硬件发生故障的指示灯)的人员来进行管理、监控和维护。他说:“只要不必再做无谓的猜测并将积极性赋予整个生态系统,人工智能和机器学习就能彻底改变这种过时的范式。”
人工智能有望对数据中心安排日常维护任务的方式产生重大影响。只要仔细审查所有相关的数据中心资源,人工智能不久将可以预测特定设施何时需要服务、升级和更换。因此,定期的维护计划将逐渐被人工智能生成的建议所取代,Grove做了这样的预测。他报告说:“这将改善正常运行时间并降低成本。”
6. 人工智能正在成为一个强大的数据中心规划工具
人工智能最振奋人心的应用之一就是为数据中心做规划。Northman说,只要从数据中心的传感器中提取大量信息,并利用从以往情境中进行学习的能力,人工智能就可以提供精细的预测,更重要的是,它可以对修改了的假设中的差异进行建模。他说:“系统就绪的时间越长,获得的信息就越多,人工智能所作的预测就越准。”
Merces报告说:“这就发生在当下”,例如,人工智能用来规划和配置电力资源,以及预测冷却需求。他指出:“人工智能还被用于规划和管理网络和带宽利用率和优化。”
7. 人工智能将管理越来越多的数据中心任务,鲜有人工参与,或根本没有
Grove说,人工智能很有可能全面抢占目前由人工处理的数据中心任务。他说:“数字生态系统需要更多即时控制和操作,这些控制和操作只能通过人工智能和机器学习来实现。此外,随着边缘计算的出现,你需要人工智能来正确地做这样的事情,这样才能够管理大量无人值守的数据中心。”
可以监控、诊断和自我修复的完全自动化的据中心,这是人们梦寐以求的东西。大数据分析公司Guavus的首席科学家Roger Brooks说:“这就需要人工智能、机器人甚至增强现实技术——机器之间互相帮助。”
乐观地看,至少从人的角度来看,人工智能仍然无法可靠地执行高层次的推理和决策任务,哪怕只是接近较低程度的可靠性。Merces预测道:“人工智能包揽了大大小小的工作,它被划分为特定的功能,虽然这些功能极尽高效,但最终,它们还是不会获得智慧。”
Northman表示同意,他说:“虽然管理者将越来越依赖人工智能,靠它来操作和管理数据中心,但我预计,人类并不会完全被排除在流程之外。虽然管理者无需再为某些数据中心承担太多的职责......但人类将继续发挥作用,防止故障的出现。”