欧洲气象云:一个OpenStack与Ceph集成用在生产中的案例

开源云中文社区
欧洲中期天气预报中心(ECMWF)是一个政府组织,成立于1975年。ECMWF总部位于英国雷丁(数据中心不久将迁往意大利博洛尼亚),业务遍及欧洲34个国家和地区。它运营着欧洲最大的超级计算机群之一,也是世界上最大的数值天气预报数据档案馆。就其IT基础设施而言,ECMWF的HPC(高性能计算)设施是全球最大的气象站点之一

欧洲中期天气预报中心(ECMWF)是一个政府组织,成立于1975年。ECMWF总部位于英国雷丁(数据中心不久将迁往意大利博洛尼亚),业务遍及欧洲34个国家和地区。它运营着欧洲最大的超级计算机群之一,也是世界上最大的数值天气预报数据档案馆。就其IT基础设施而言,ECMWF的HPC(高性能计算)设施是全球最大的气象站点之一。利用哥白尼气候变化服务(C3S)、哥白尼大气监测服务(CAMS)和WEkEO(数据和信息访问服务(DIAS)平台)的云基础设施和欧洲气象云,ECMWF的团队维护着一个250 PB大小、每天增长250TB的气候数据存档。

1.png

欧洲气象云:

三年前,ECMWF和欧洲气象卫星利用组织(EUMETSAT)合作建立了欧洲气象云,旨在使基于云的基础设施更容易处理天气和气候大数据。为了使计算资源(云)更接近其大数据(气象档案和卫星数据),ECMWF的试点基础设施是使用开源软件Ceph和使用TripleO的OpenStack。

下图显示了欧洲气象云整体基础设施的当前状态,包括两个OpenStack集群:一个使用OpenStack Rocky构建,另一个使用OpenStack Ussuri构建。当前配置的总硬件包括大约3000个vCPU、两个21 TB RAM的集群、1PB的存储空间和2×5个NVIDIA Tesla V100 GPU。

2.png

与Ceph集成:

下图显示了欧洲气象云的云基础设施。如你所见,Ceph是与OpenStack分开构建和维护的,这为欧洲气象云团队在同一Ceph存储上构建不同集群提供了很大的灵活性。它的两个OpenStack集群使用相同的Ceph基础设施和相同的rbd池。除了一些常见的硬盘故障之外,Ceph的表现也非常出色,欧洲气象云的团队正在计划逐步迁移到CentOS8,并在对开发环境进行大量测试之后,在一个实时集群上升级到Octopus和cephadm。

3.png

Rocky版本的OpenStack:

欧洲气象云中的首个OpenStack集群建于2019年9月,基于带TripleO安装程序的Rocky。与此同时,欧洲气象云的工程师们还创建了另一个开发环境,其中OpenStack和Ceph集群的配置类似于测试实验。

经验和问题:

他们的部署大约有2600个vCPU,内存为11TB,没有任何重大问题。通过简单地配置Ceph,外部Ceph集群集成以最小的工作量工作——只对ceph-config.yaml配置稍加修改。这两个外部网络(一个面向公众,另一个用于快速访问其300PB数据存档)非常简单。

他们的大多数虚拟机都连接到两个没有浮动IP的外部网络,这是一个具有挑战性的虚拟机路由问题,没有在交换机上动态路由。为了解决这个问题,他们使用了dhcp钩子,并在向用户提供映镜像之前配置了VM路由。

他们在使用NIC bond接口配置以及在开始时配置交换机时遇到了一些问题。因此,工程师们决定不使用链路聚合控制协议(LACP)配置,现在他们为OpenStack部署了一个网卡(NIC)。他们还遇到了负载均衡即服务(LBaas)的一些问题,这是由于Octavia在每个部署上覆盖证书。

一旦找到了解决这些挑战的解决方案,工程师们就更新了实时系统,并将整个集群从一个NIC迁移到多个NIC部署中,这对用户来说是透明的,没有停机时间。第一个集群被重新部署,网络被重新配置为分布式虚拟路由(DVR)配置,以获得更好的网络性能。

Stein到Ussuri的升级工作:

2020年3月,欧洲气象云的工程师为OpenStack和Ceph集群增加了更多的硬件,他们决定升级到OpenStack的最新版本。

经验和问题:

首先,为了更好地管理和作为备份和恢复的安全网,他们将其Rocky云端转换为虚拟机。从2020年3月到5月,他们调查并测试了升级到Stein的过程(首先是云下升级,然后是云端过度升级到测试环境)。由于Ussuri是基于CentOS8的,他们直接从Rocky跳到了Ussuri,并决定直接在OpenStack Ussuri上部署新系统。

OpenStack Ussuri集群:

第二个基于Ussuri的OpenStack集群首次构建于2020年5月,也就是5月13日Ussuri发布后的17天。这个集群是一个普通的配置,这意味着尽管网络配置了OVN和25个节点的提供商网络,但它们没有与Ceph存储进行任何集成。

经验和问题:

基于Ansible而不是Mistral的新构建方法有一些问题,比如从堆栈切换到heat admin,这不是用户用来部署的。此外,他们还试图快速理解和掌握主机系统和服务容器的CentOS8基本操作系统。欧洲气象云的工程师们也继续使用OVS而不是OVN,因为分配浮动IP地址的含义。在OpenStack社区的帮助下,问题得到了解决,并于2020年6月中旬重新构建了集群。

Nvidia GPU的配置很简单。然而,由于在安装和配置GPU驱动程序到节点时,OVS还没有在Ussuri集群中实现IPv6,因此OVS试图在引导期间绑定到IPv6地址,这导致引导时间大大增加。一个解决方法是显式地将PIv6配置删除到它们的GPU节点。所有具有GPU的节点也被解析为普通计算节点,并用Ansible playbook配置了nova.conf。

下一步:

在欧洲气象云的基础设施方面,工程师们正计划将该基础设施与其他内部系统集成,以便更好地监控和记录。他们还计划逐步淘汰Rocky集群,并将所有节点转移到Ussuri。他们将继续运行、维护和升级云的基础设施,用上OpenStack和Ceph的最新版本。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论