这类存储,唯一没有国产化,AI数据中心不可或缺

黄晶晶
然而,中国已是数据大国,仅中国市场的机械硬盘(HDD)年消耗量就接近600亿元。这一核心技术的缺失,使中国产业在全球供应链中处于被动地位。不过,数据存储正在加速创新进化,即便HDD也不例外,以应对AI浪潮带来的数据爆炸需求。

本文来自微信公众号“电子发烧友网”,【作者】黄晶晶。

电子发烧友网报道(文/黄晶晶)近日,华为高级副总裁、云CEO、数据存储产品线总裁周跃峰直言,中国今天已经解决CPU、内存、固态硬盘等器件的国产化,唯一没有解决国产化的存储器件就是机械硬盘HDD。然而,中国已是数据大国,仅中国市场的机械硬盘(HDD)年消耗量就接近600亿元。这一核心技术的缺失,使中国产业在全球供应链中处于被动地位。

不过,数据存储正在加速创新进化,即便HDD也不例外,以应对AI浪潮带来的数据爆炸需求。

市场格局

目前,全球HDD市场主要由西部数据、希捷和东芝三家厂商掌控。其中,西部数据和希捷占据了绝大部分市场份额,两者的合计份额超过85%。

《2025中国机械硬盘行业白皮书》分析指出,虽然PC、移动设备和部分游戏主机的存储需求正在转向SSD,但近线企业级硬盘目前已占据HDD行业总存储容量和收入的80%以上。在超大规模数据中心的备份、归档以及视频监控存储需求等方面仍然大有可为。

AI数据中心对HDD的技术需求

AI数据中心架构的计算集群包括高性能处理器、高带宽内存HBM、动态随机存取内存DRAM和高性能本地固态硬盘SSD,它们形成强大的AI训练引擎。

微信图片_2025-12-15_090601_656.png

设备内置内存具备高性能,通常由连接到处理器(图形处理单元GPU和中央处理单元CPU或数据处理单元DPU)的HBM或DRAM组成。DPU是卸载功能引擎,连接到CPU,有助于处理特定任务。一些架构会使用DPU,而有些则不会使用。内存的高吞吐量可实现AI的高效数据提取和模型训练。

微信图片_2025-12-15_090612_089.png

希捷分析AI数据中心对HDD的需求指出,SSD的低延迟和充足容量可实现快速推理和对存储内容的频繁访问。在AI数据中心架构中,高性能本地SSD包含在计算集群中,靠近处理器和内存的位置。本地SSD通常运行三级单元内存,也具有高耐用性,但通常比网络SSD更昂贵,而容量却没有网络SSD高。

网络SSD具有比本地SSD更高的数据存储容量,用在存储集群中,并在整个AI应用工作流程中承担其他特定职责。它们的性能速度与本地SSD的速度不一致。相对来说,网络SSD在每天硬盘写入次数方面不太耐用,但它们的容量较大,弥补了这一不足。

网络硬盘也是AI数据中心架构存储集群的一部分,是AI工作流中最具扩展性、最高效的IT设备。这些设备的访问速度相对适中,但是容量很高,非常适合不需要快速频繁访问的实例。

AI工作流在使用和创建的无限循环中运行,不仅需要支持计算的处理器和内存,还需要存储组件。AI工作流的相互关联的步骤包括搜寻数据、训练模型、创建内容、存储内容、保留数据和重用数据。

微信图片_2025-12-15_090614_076.png

具体来说,在开始的数据搜寻阶段,网络SSD和网络硬盘用于存储创建新内容所需的大量数据。网络SSD充当可立即访问的数据层,提供更快的性能。网络硬盘提供充足、密集、可扩展的容量并通过长期保留和数据保护来提供原始数据。

在模型训练中,HBM和DRAM对于快速数据访问至关重要,并将活动数据集保存在处理器附近。本地SSD用作此阶段中所用数据集的快速访问存储。它们存储中间训练结果并允许快速检索大型数据集。它们对于需要快速访问大量数据的训练模型特别有用,例如涉及数百万张图像的图像识别模型。机械硬盘以经济实惠的方式存储训练AI模型所需的大量数据。除了提供所需的可扩展容量,机械硬盘还可以帮助保持数据的完整性,存储和保护已创建内容的复制版本。机械硬盘与其他存储选项相比更经济高效,可提供可靠的长期存储以及高效保存和管理大型数据集。

在内容存储阶段,内容存储阶段依赖于网络SSD和网络硬盘来保存数据以用于持续优化、质量保证和合规性。网络SSD提供速度匹配的数据层,并用于AI生成内容的短期、高速存储。与机械硬盘相比,SSD的容量较低,所以通常用于存储经常访问的内容或必须立即供编辑和提炼的内容。机械硬盘用于存储和保护所创建内容的复制版本,并提供关键容量,用于存储AI处理过程中生成的内容。机械硬盘特别适合这一用途,因为与其他存储选项(如SSD)相比,它们以相对低的成本提供较大存储容量。

在数据保存阶段,复制的数据集将跨地区和环境保留。存储的数据是值得信赖的AI的支柱,这样数据科学家才能确保模型按预期运行。而网络SSD作为性能媒介,将这些机械硬盘连接到本地SSD层,促进数据在生态系统中移动。机械硬盘是实现长期数据存储和数据保护的主要工具。它们帮助维护AI内容创建的结果,安全地存储生成的内容,以便在需要时访问这些内容。它们还提供高效处理不断增长的数据量所需的可扩展性。

在数据重用环节,源数据、训练数据和推理数据将应用于工作流的下一次迭代。内容输出反馈到模型中,提高其准确性并推动新模型的生成。网络机械硬盘和SSD支持地理位置分散的AI数据创建。原始数据集和结果成为新工作流的来源。SSD可以加速以前存储的数据的检索。低延迟访问促进了将这些数据快速重新集成到AI工作流中,从而减少了等待时间,并提高了整体系统效率。机械硬盘可满足AI数据重用阶段的大容量存储要求,从而以合理的成本实现该模型的后续迭代。

微信图片_2025-12-15_090619_286.png

HDD存储厂商的技术创新

希捷表示,Seagate硬盘采用Mozaic 3+™(魔彩盒3+)技术(特有的热辅助磁记录(HAMR)实施技术)。热辅助磁记录(HAMR)技术被认为是实现30TB以上超大容量HDD的关键技术。其磁密度、效率和空间优化优势使其成为AI应用的强大选择。这些硬盘提供前所未有的每盘片3TB+的磁密度,目前可提供30TB起的容量并向超大规模客户批量出货。Seagate已经在测试Mozaic(魔彩盒)平台实现每盘片4TB+和5TB+的容量。与当前这一代垂直磁记录(PMR)硬盘相比,Mozaic 3+(魔彩盒3+)硬盘的运行功耗只有PMR的四分之一,每TB隐含碳排放为十分之一。

西部数据的ePMR(能量辅助垂直磁记录)和UltraSMR(超长磁记录)技术是其硬盘驱动器(HDD)产品线中的关键创新,旨在提升容量、性能和能效,以满足云存储、人工智能等数据密集型应用的需求。

ePMR技术通过在写入过程中施加能量(如热能或微波)辅助磁记录,突破传统垂直磁记录的超顺磁极限,从而提高磁记录密度。例如,西部数据的Ultrastar DC系列HDD基于ePMR技术实现了24TB至32TB的超大容量,适用于数据中心的近线存储和冷数据存储场景。

UltraSMR技术是SMR(叠瓦磁记录)的演进版本,通过优化磁道排列和引入大数据块编码、先进纠错算法,在ePMR基础上进一步提升容量。

相比传统CMR(连续磁记录),UltraSMR可实现超过20%的容量增益,同时保持较低的每TB功耗。‌西部数据的32TB Ultrastar DC HC690 UltraSMR HDD是该技术的代表产品,专为大规模数据湖和AI工作负载设计,支持高性价比的长期存储。

小结

可以看到,HDD机械硬盘在当前数据中心架构中依然具备不可替代的重要性,它与SSD固态硬盘形成互补,共同支撑数据中心的存储需求,其在成本、容量、可靠性和应用适配性等方面具有优势。而对于国内存储的发展,在周跃峰看来,AI时代,数据存储将不再是传统意义存储,应从极致性能、高可扩展、数据编织、数据韧性、新语义、可持续发展等六个方面,全产业应该加速创新进化。存储介质应该加快多元化、均衡发展,从材料、制造设备和工艺等方面进行突破。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论