有了AI,IT运维原来可以这么轻松

Maria Korolov
使用人工智能驱动的IT运营技术可以自动监控和管理IT产品。云平台、托管服务提供商和进行数字化转型的企业已经开始从这种新兴的IT趋势中获益。

现在的企业发现,人工智能是更好的IT监控技术,因为人工智能可以在企业受到负面影响前,就提前发现并自动修复问题。那么这样的人工智能技术是什么?又是如何为企业省时省力的呢?让我们一起来看看。

2345截图20211028093243.png

使用人工智能驱动的IT运营技术可以自动监控和管理IT产品。云平台、托管服务提供商和进行数字化转型的企业已经开始从这种新兴的IT趋势中获益。

这种新兴的技术被称为AIOps,它可以提前阻止潜在的宕机和性能问题对运营、客户和企业最终利润产生的负面影响。不过,企业开始部署更高级的人工智能系统,是因为它不仅可以识别问题,或在问题发生之前预测问题,还可以对事件做出智能、自动化的缓解举措。

那么AIOps究竟是什么?企业又是如何使用它的?在本文中,我们将更深入地介绍AI辅助IT运营的技术、战略和挑战。

什么是AIOps?

AIOps是一种新兴的IT技术,它将人工智能应用于IT运维,帮助企业实现智能管理基础设施、网络和应用程序,以提高性能、适应性、容量、运行时间,甚至安全性。通过将传统的阈值警示和手动流程转移到利用人工智能和机器学习的系统,AIOps使企业能够更好地监控IT资产并预测可能发生的负面事件和不良影响。

职业服装零售商Carhartt的CIO John Hill在三个主要领域:服务管理、绩效管理和IT自动化中利用AIOps。现在,由于智能监控,Carthartt可以在问题影响到用户或客户之前就发现问题。

“AIOps会监控环境和了解正在发生的事情的整个过程,并根据这些指示信号采取行动,”Hill说,“以前,人们会根据停电或已经产生的异常工作迹象得知有哪些地方需要修复,但是在发现之前,客户体验就已经被损害了。”

AIOps工具

大部分AIOps平台是建立在历史悠久的监控系统上,还有一些是来自于人工智能实验室,然后向外发展而成。好的AIOps工具会生成关于机器负载的前瞻性猜测,然后观察是否有产生偏离的情况。当异常出现,就会发出警报,生成电子邮件、Slack帖子,如果偏差足够大,则会生成寻呼机消息。复杂的AIOps工具还提供“根本原因分析”,它创建流程图来跟踪问题,看问题是如何在同一个现代企业应用程序中通过不同机器传播的。每个考虑采用AIOps的人都希望评估每个AIOps产品与特定数据库和服务的集成程度。以下这些AIOps工具是当今最好用的工具中的几个:

●AppDynamics

●BigPanda

●Datadog

●Dynatrace

●GitHub Copilot

●IBM Watson Cloud Pak for AIOps

●LogicMonitor

●Moogsoft

●New Relic One

●Splunk

AIOps应用案例

AIOps可能已经在你的IT产品中发挥作用了,而你甚至都不知道。高级的CRM或ERP系统通常会内置智能管理系统。大多数云平台也会使用机器学习驱动的监控和管理工具。

但是依赖单点解决方案中的内置功能也存在缺点。在AIOps Exchange的调查中,65%的IT组织表示,他们仍然依赖监控方法(无论是否智能),这些方法要么是孤立的、墨守成规的,要么无法满足整个IT环境的需求。此外,根据BigPanda最新的一项调查显示,42%的IT组织在他们的IT环境中使用了超过10种不同的监控工具。

Carhartt一开始就是使用了这种方式。“以前,面对不同的环境,我们必须对它们进行独立监控,”Hill说。为了管理这种复杂性,Hill选择将监控结合到两个平台上,首先使用AppDynamics进行应用程序性能监控,然后利用Turbonomic来监视Carhartt的基础设施。

2345截图20211028093243.png

黑色星期五和网购星期一的购物高峰,通常会使公司网站出现需要即时修改的性能问题。Hill说,当公司发现问题时,客户已经感觉到服务质量下降了。

自从Carhartt在2017年秋季部署AppDynamics到现在,黑色星期五和网购星期的峰值期间已经实现了零宕机。

“我们取得了创纪录的增长,”Hill说,“我们的增长速度是整个行业的两倍,而且再也没有出现过任何之前所经历过的宕机或性能下降。”

Carhartt在2019年初添加了Turbonomic,用于本地和云环境的资源管理。Hill表示,新系统使利用率从70%增加到92%。“它大概为我们节省了25%的基础设施成本。”

增加利用率需求是自动处理的,无需人工干预,而是否为此减少容量仍需要人工批准。

“它一旦监测到我们遇到了容量挑战,就会向ServiceNow提出变更请求,”Hill说,“当我们有太多容量时,它会在ServiceNow中创建一张通知单,然后有人会先快速地审查一下,只需单击一下,所以目前我们还不需要让它实现自动化。”

该公司的下一步是把业务任务自动化,例如使用文本识别和自然语言识别来处理客户订单。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论