文章目录[隐藏]
数据中心自1940年代就已存在,第一批计算机专用数据室被用于军事目的。随着计算和存储需求在此后的几十年里呈指数级增长,应用扩展到生活的各个领域,组织越来越多地寻求专用数据中心来容纳他们的基础设施。
为了降低成本并在竞争中脱颖而出,自HPC出现以来,外包数据中心基础设施几乎已成为必需。HPC是一种功能强大但在密度、热量和带宽方面要求很高的解决方案。这些数据中心需要解决许多高性能计算机同时运行所需的热量和功率密度所带来的挑战。
哪些行业使用高性能计算?
由于HPC可以以更快的速度将数据分析和人工智能结合在一起,因此不出所料,采用HPC数据中心的顶级公司都在云计算和IT行业中。但其他行业的公司也可以利用HPC的力量。
这可能包括:
- 研究实验室
- 金融科技
- 天气预报
- 媒体和娱乐
- 卫生保健
- 政府和国防
支持HPC的数据中心可以满足客户对快速网络不断增长的需求,同时跟上日益数字化的格局。
HPC的三个关键系统
要构建适应HPC的基础架构,了解HPC集群的三个关键系统非常重要:计算、存储和网络。
计算
高效的HPC系统需要一组计算机服务和软件程序,它们协同工作以运行算法程序。每个模块都需要与集群中的其他模块保持同步;否则,整个HPC系统将变得过时。
HPC的目标是执行高速计算,这需要聚合来自不同硬件类型的计算机能力。数据中心拥有足够的空间和能力来容纳支持HPC操作所需的计算机系统和硬件,仅HPC计算就需要大多数企业无法处理的电源和冷却协调。
存储
为了容纳HPC处理的海量数据,其存储系统应尽可能频繁地从CPU卸载,而不中断计算操作。根据Weka的说法,HPC存储系统需要满足以下这些需求:
- 任何节点的数据随时可用
- 可用数据必须是最新的
- 可以处理任何大小的数据请求
- 支持面向性能的协议
- 使用最新的存储技术(例如SSD)
- 扩展到毫秒以跟上恒定的延迟
网络
HPC网络的拓扑结构与您的办公室内部网非常不同。除了CPU和存储之间的持续数据传输的极端要求外,构成HPC环境的许多不同的计算组件被视为一台计算机,由“结构”组合在一起。“HPC结构的关键概念是拥有大量可扩展带宽(贯穿),同时保持超低延迟。”
降温设施
鉴于HPC基础设施的密度和产生的热量,冷却可能是一项重大挑战。现代数据中心使用的传统热通道遏制系统可以有效地冷却当今的50kW HPC机架。展望未来,HPC集群可能会增加密度并刺激数据中心实施更普遍可用的液体冷却。根据研发机构国家可再生能源实验室的说法,液体冷却可以提供比空气冷却高1,000倍的冷却能力,而且物理占地面积更小。浸没式液冷数据中心部署灵活性更高,且面向未来的客户。
以易飞扬创新性的液冷互连光模块和互连解决方案为例。其中液冷高速模块可在1米深的氟化液和矿物油中稳定运行(已通过客户的长期认证),相比传统制冷方案,具备更高的散热效率和更低的能耗,可将高性能计算的算力提升到一个新的水平。
高性能组件
HPC集群的设备之间需要采用高性能并行互连组件进行连接。易飞扬是并行光互连计算的先锋,自2013年起,易飞扬就重点投入高性能并行光模块和互连线缆的开发,系列产品涵盖10G、25G、40G、100G、200G、400G和800G等速率,支持INFNIBAND协议。
- 基于Intel和NVIDIA的芯片设计支持并行互连组件的服务器光网卡,从10G到200G,并正在向400G/800G延伸;
- 基于VCSEL激光器、DML激光器或硅光技术平台设计的高速并行光模块,如100G QSFP28 SR4/PSM4,200G QSFP56 SR4/DR4,200G QSFP-DD SR8/PSM8和400G QSFP-DD SR8/DR4等;
- 基于低功耗设计的短距离并行DAC和AOC互连线缆,如400G QSFP-DD DAC/AOC、 800G QSFP-DD DAC/AOC等;
- 可支持系统设备自环测试的电回环模块;
- 创新性的液冷互连光模块和互连解决方案。
高质量的系统、组件及设施共同构建出高性能计算数据中心,这些数据中心还提供HPC所需的经济实惠的电力、网络、可扩展性、冗余和安全性。