当AI走进数据中心 将擦出怎样的火花?

新天域互联
毫无疑问,人工智能(AI)正在渗透技术的各个方面,从发现早期癌症到理解所有形式的人类语言,以及用你的猫在实时高分辨率视频中交换你的脸。

随着人工智能时代的到来,数据中心也变得越来越智能化,如今人工智能已经取代了云计算和大数据的位置,成为数据中心的市场热点。人工智能在数据中心中的应用几乎改变了每个数据中心的应用程序,重塑了软件开发生命周期(SDLC)。

毫无疑问,人工智能(AI)正在渗透技术的各个方面,从发现早期癌症到理解所有形式的人类语言,以及用你的猫在实时高分辨率视频中交换你的脸。消费者应用程序的踩踏加剧了主流需求,社会接受度和人工智能日益普及的推动和资助,现在,思维系统正在向企业IT领域发展。

企业IT已经成为许多任务的主流,包括网络安全,IT运营,监控,数据分析,业务流程自动化和基础架构配置,以应对缓慢增长的熟练劳动力池与快速增长的IT之间日益扩大的差距工作负载。

然而,对于数据中心而言,它们仅代表两个聚集季风的第一个雨滴:用于数据中心的AI和用于AI读取的数据中心两次。

如今,智能产品已经通过筛选令人眼花缭乱的操作遥测数据,发现异常,关联事件和确定根本原因来增强IT运营和分析。我们还看到智能技术被添加到基础设施配置和流程自动化中,每周都有新产品上街,并将AI带入新的领域。随着AI在IT运营中的成熟,它从被动的记者转变,解释发生了什么,提出建议或将异常识别为预测故障的更积极的参与者,自主调整流程的步骤,以及自动部署或销毁容量。

但最大的影响可能是数据中心将AI与数据中心信息管理(DCIM)系统连接起来,以提供智能数据中心运营。2014年,Google使用DeepMind观察并建议对其数据中心的风扇,通风和冷却设备进行控制调整,从而将公用事业成本降低40%。1今年,谷歌全力以赴,将所有冷却系统操作的完全控制权交给了一个自学成才的算法,该算法不仅可以推荐更改,还可以直接自动调整控件,观察结果,学习并变得更聪明。2量化结果为时尚早,但早期迹象看起来很有希望。

但我们刚开始。在途中,智能产品将在行和机架上虚拟地重新定位发热计算负载,以实现最佳温度控制。其他DCIM供应商正在研究AI算法,以根据不断变化的硬件容差,功耗/成本趋势和瞬态工作负载来改变数据中心目标温度。除了冷却之外,人工智能驱动的配电和管理节省数据中心成本的潜力同样引人注目,仅占美国3电力消耗的1.8%。跨所有数据中心在全球范围内扩展,影响可能很大。

展望未来,新兴的智能DCIM系统将数据中心物联网传感器数据(如热量,气流,振动,超声波,功耗,水和烟雾检测)整合到基于AI的平台中,不仅可以检测异常的数据中心行为,还可以确定问题的根源和原因。4很快,这些智能DCIM系统不仅会说出某些事情失败的时间,地点和原因,而且还会在出现问题之前预测性地提醒操作员5,在某些情况下,还会自动进行拦截。

由于人工智能几乎改变了每个数据中心应用程序,它也在重塑软件开发生命周期(SDLC)。传统应用程序通过程序化更改演变为其底层代码库,然后使用严格测试进行验证,并以受控,可管理和可重复(和单向)方式部署到生产中。但是,基于AI的应用程序不依赖于代码更改或单向部署。相反,许多人在开发环境中发展更智能和更智能的模型并将其部署到生产中,而其他人则在生产中进行自我训练,在那里他们从现实世界数据中学习并将这些知识传播回开发环境。这种双向细微差别对数据中心网络拓扑结构具有根本性影响。

无论是嵌入在更传统的第三方应用程序中还是内部开发的人工智能算法,在对尽可能真实且相关的大量数据进行培训时效果最佳。因此,在许多情况下,实时生产数据最适合培训,但在其他应用中,非生产环境中的外部数据系统,以及由此产生的智能模型被部署到生产中。在这两种情况下,人工智能应用程序不仅仅是从非生产到生产,而是在两者之间进行排球,要求环境之间的网络分割变得更具渗透性,而不是可防御的护城河。

人工智能培训需要大量的计算和大量的数据-每个人的数据越多越好。为了满足这种对计算能力的巨大需求,人工智能培训越来越多地发生在以CPU为中心的非CPU服务器上,这些服务器基于GPU,FPGA,定制ASIC或专用深度学习单元,可提供数量级的性能提升。不幸的是,这些系统是耗电量大,吞吐量高达30-50千瓦/机架,而且一些估计预测下一代系统将达到惊人的100千瓦/机架。40多个数据中心的运营商Flexential的首席云官Jason Carolan表示,“今天的大多数数据中心都没有大规模的支持,没有对液体冷却等冷却控制解决方案进行大量的再造”。6

除了动力之外,这些超级计算机的运行速度与它们接收的训练数据一样快。结果是对大型,廉价和闪电般快速的近线存储的需求不断增长,触发了更快的控制器,协议(例如,NVMe和NVMe-oF)和媒体(例如,3D XPoint和3D NAND)的新存储支持。

在许多情况下,基于AI的应用程序需要非生产培训环境,其计算和存储容量比生产更高。这种情况扭转了历史悠久的传统,即从退役生产手工制造非生产环境。相反,我们将看到这些闪亮的新计算和存储平台部署到开发和培训环境中,以及最先进的网络,SAN和相关的监控和管理工具。这些演进需要对整个数据中心的服务器和存储拓扑进行彻底的转换。

即将到来的基于人工智能的产品季风将触发运营,自动化,监控,合规,安全,开发和云集成的下游分水岭,但这些都将成为数据中心过多的基础变革。有远见的数据中心运营商能够支持基于AI的应用程序并使用人工智能进行操作,他们将迎来风暴。

(原标题:人工智能即将来到我们的数据中心)

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论