AI如何推动网络基础设施的变革

Gary Bernstein
根据Statista的数据,2023年全球人工智能市场价值将达到1423亿美元,其中金融、医疗保健和高科技/电信市场将率先采用人工智能。

本文来自微信公众号“CDCC”,作者/Gary Bernstein。

人工智能技术的最新发展几乎没有一天不成为头条新闻。早在2022年11月,OpenAI就推出了ChatGPT大型语言模型,2023年4月,微软Azure OpenAI服务的GPT-4发布,而就在今年5月,谷歌推出了与之竞争的全新Bard AI聊天机器人。毫无疑问,人工智能拥有改变我们日常生活的巨大力量。从聊天机器人到人脸识别,再到自动驾驶和早期疾病诊断,人工智能的应用似乎永无止尽。

根据Statista的数据,2023年全球人工智能市场价值将达到1423亿美元,其中金融、医疗保健和高科技/电信市场将率先采用人工智能。在最新的数据中心内,人工智能已被广泛用于监控数据中心资产、主动检测故障以及通过更好地管理PUE(能源利用效率)来提高能效。我们今天能够看到的是,不仅是那些超大型独角兽企业,许多大型企业公司也都在利用人工智能。

1.png

“InfiniBand”和“以太网”

如今,许多支持人工智能的网络都在使用InfiniBand技术。这是一个有趣的发展,因为以太网是大多数数据中心的全球标准,而InfiniBand目前只占市场的很小一部分,传统上只用于HPC网络。现在,InfiniBand市场的领导者Nvidia与思科、Arista和Broadcom等众多领先的以太网交换机和芯片制造商之间的竞争已经展开。博通公司最近推出了"Jericho3-AI"StrataDNX™芯片,将使用以太网而不是InfiniBand来构建人工智能集群。无论采用哪种协议,InfiniBand和以太网都有高带宽和低延迟的要求,都需要高质量和高性能的光纤布线解决方案。

对电力和带宽的需求激增

数据中心面临的两个主要挑战与极端的电力需求和相关的设备冷却要求以及GPU(图形处理器)过高的带宽需求有关。

带有运行人工智能应用的GPU的超级计算机(如Nvidia的DGX平台)耗电量巨大,并且需要多个高带宽连接。Nvidia有DGX A100、H100,并且刚在2023年5月的Computex大会上推出了GH200。这些GPU平台需要为每个6U机箱提供6.5kW到11kW以上的功率。如果将这些数据与以往满载数据中心机柜的整柜7或8kW平均功耗,以及15至20kW的最大功耗相比,你就会明白人工智能到底有多耗电。

在带宽方面,这些GPU超级计算机通常需要多达8 x 100Gb/s(EDR)或200Gb/s(HDR)的连接。每个GPU提供8个连接,总带宽可达8x200G。

Nvidia首席执行官Jensen Huang最近在datacenterfrontier.com上表示,“生成式人工智能正在推动计算需求的指数级增长”,“你会看到一个10年过渡期的开始,基本上是回收或再利用世界上的数据中心,并将其构建为加速计算”。

IT基础设施如何应对?

极端的供电和冷却要求迫使数据中心管理者重新思考基础设施的设计并实施变革。这通常包括改变网络设计和更多地分散GPU超级计算机机柜,可能使用列末(EoR)拓扑结构,以更好地应对温度上升。这意味着交换机到GPU的物理距离必须增加。为了延长交换机到GPU的连接,数据中心运营商可能需要使用更多的光纤布线,而不仅仅是传统的交换机到交换机之间的结构化光纤布线。由于连接距离较长,直连铜缆(DAC)可能不是一个好的选择,因为在这种速度下,这些线缆组件的最大连接距离被限制在3至5米。除了光纤布线外,有源光缆(AOC)也是一种可行的选择,因为与DAC相比,它们可以覆盖更长的距离。有源光缆的优点包括其功耗要比收发器(光模块)低得多,并且能改善延迟。西蒙提供的有源光缆可以以0.5米为单位递增,从而对线缆管理更为友好。

1.png

数据中心主干网的交换机到交换机连接需要并行光纤技术来支持不断增长的带宽需求。目前的许多并行光纤技术方案都采用8芯光纤与MPO/MTP光纤连接器相连接。这些Base-8 MPO/MTP解决方案可采用多模或单模光纤,并能够轻松迁移到更高速度。企业数据中心在向100Gb/s和400Gb/s升级时应考虑使用Base-8 MPO/MTP OM4布线解决方案,而云数据中心在向400Gb/s和800Gb/s迁移时应选择Base-8 MPO/MTP单模布线解决方案。

市场上的创新光纤配线系统可以灵活地支持不同的光纤预端接模块,包括MTP-LC的Base-8和Base-12模块、MTP直通模块和熔接模块。这些系统便于接入、易于升级并改进了光缆管理。

由于延迟在人工智能应用中变得非常重要,西蒙推荐使用超低损耗(ULL)性能和MTP/APC连接器的“支持人工智能”解决方案。在部署新短距离单模应用(支持100、200和400 Gb/s速率,传输距离可达500米)时,应考虑采用超低损耗光纤布线。超低损耗布线可支持人工智能应用所需的更为严格的插入损耗要求,从而提升整体网络性能。西蒙还建议使用APC(斜面物理接触)光纤连接器,如MTP/APC连接器,APC除了常用于单模连接,还可以用于某些多模布线应用。APC(与UPC连接器相比)的端面几何形状经过斜面研磨处理,可提高反射率,从而改善光纤性能。

人工智能是一种颠覆性技术,它也有可能彻底改变我们的生活和工作方式。数据中心运营商需要为人工智能的需求做好准备,现在就应该开始规划。他们应该考虑能快速、轻松地迁移到更高数据传输速度的解决方案,同时考虑如何提高数据中心的能效。为人工智能需求做好准备的数据中心将处于有利地位,能够随着人工智能的发展和应用,充分拥抱人工智能带来的机遇。

资料来源:西蒙布线

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论