谷歌放大招!用AI来管理数据中心的制冷,越用越省电!

数据中心能耗和性能
数据中心服务器数量一般都在万级规模,在保障服务的性能之外,产生了巨大的能耗成本。比如,现在大规模数据中心为了减少制冷的用电量,甚至会在冰岛或者海底建立数据中心,不可谓不疯狂。
  数据中心服务器数量一般都在万级规模,在保障服务的性能之外,产生了巨大的能耗成本。比如,现在大规模数据中心为了减少制冷的用电量,甚至会在冰岛或者海底建立数据中心,不可谓不疯狂。
 
  2016年时,DeepMind和谷歌联手开发了一个基于AI的动作推荐系统,向负责维护、调节冷却系统的数据中心运营人员推荐不同状况下的应对方法,它让谷歌当时已经具有很高能源效率的推荐系统数据中心向前更进了一步。他们的出发点也很简单,为了应对全球气候变化,大型能耗场所的一点点小改进也能在在减少能源消耗、减少二氧化碳排放方面有重大影响。这个工作其实早期并没有受到太大关注,当时看论文也没发现有DeepMind这个团队,作者就一个人:Jim Gao。可以参考论文:Machine Learning Applications for Data Center Optimization
 
  最近,DeepMind把这个系统升级到了一个全新的级别上:不再像原来的系统那样向人类推荐一些动作,然后由人类去完成,AI系统现在会直接控制数据中心的冷却系统,当然了它也仍然受到数据中心运营人员的专业监控。这是首个基于云的控制系统,已经在多个谷歌的数据中心中安静地运行、持续地节省能源。它的工作流程大致如下:每隔5分钟,这个基于云的AI会从数据中心的数千个传感器中采集数据,获得数据中心冷却系统的状态快照,然后把它输入深度神经网络。这个网络会预测各种可能的操作的不同组合会如何影响数据中心的能量消耗。然后AI就会就会在满足鲁棒安全性限制的条件下判断出一组能够最小化能源消耗的动作。这些动作的判断结果接下来会被发回给数据中心,由本地的控制系统验证并执行。
 
  虽然只上线了几个月时间,这个系统已经可以稳定地节约平均30%左右的能源,而且他们还期待系统未来可以改善更多。这是因为随着数据更多,系统的优化判断能力也会变得更强,如下图。
 
 
  蓝色可以理解为训练时间,绿色为制冷用电量
 
  随着技术越来越成熟,DeepMind和谷歌的研究人员未来也会把系统的优化边界设置得宽松一些,来达到更好的能源节约效果。这个AI直接控制的系统时不时找到一些新的方法管理冷却系统,有一些方法甚至让数据库操作人员觉得惊讶。与这个系统紧密协作的一位谷歌数据中心运营人员就惊讶道:「这个AI会利用冬天外面比较冷的特点,产生比平时更冷的冷却水,然后减少了给数据中心降温所需的能源消耗。规则是不会自己变得越来越好的,但是AI可以啊。」。缺少解释性,但就是有用,也是AI的霸道之处。
THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论