基于高性能计算平台上应用的特点,至成恒业在设计此方案时充分考虑到铁道科学研究院的需求,因此我们从以下方面进行了相关的分析:
高性能运算用户的计算是一种计算量巨大、计算非常复杂的数据处理过程,而且计算过程计算节点之间、计算节点与存储系统之间的通讯也极其频繁。因此,该系统应用处理的高效能计算必须具有相应的特点。
计算量巨大、计算非常复杂的数据处理过程,各种数据计算模式,都对计算性能要求较高。用户的高效能计算机力求在体系结构、多处理机芯片组、高性能节点操作系统、高可扩展互连网络、高吞吐率通信软件、多线程分割全局地址空间编程模型及编译器等核心技术上实现较大突破;并提供高效能计算机的高密度节点、可靠的系统结构、虚拟化软件、高效能海量存储、文件系统、大规模系统的管理软件、系统级鲁棒性技术、并行,串行算法等产品及技术,从而实现系统的高性能、可编程性、可移植性和稳定性。
计算节点之间、计算节点与IO节点之间以及IO节点和存储系统之间的通讯极其频繁,因此对整个系统的I/O性能也提出了极高的要求。
至成恒业公司在IA架构的HPC方案中将严格遵循MAPSS(可管理性,可用性,高性能,可扩展性,可服务性)的理念,采用Cluster作为体系结构,以基于Intel架构的服务器做为节点,通过高速通信网络实现节点间的互连,对外提供单一系统映象,以支持大规模的科学计算。它具有节点性能高、节点间通信高效、基础架构远备可靠和集群管理简洁易用、存储系统性能卓越等技术特色。另外,对于计算节点的电源、风扇等关键部件提供冗余,对软硬件资源提供实时的监控管理,对重要应用提供故障恢复功能,对作业实施负载均衡,具有可靠性高、可用性强、可维护性好等特点,完全满足用户对地球物理地球化学方面的应用的计算。
铁道科学研究院的HPC系统是一个典型的大规模数据处理与密集计算相结合的系统。随着数据资料处理技术的不断发展,原始数据量和处理的中间结果及最后结果的数据量均以几何级在数据不断的增长,同时由于硬件技术的不断发展,结果是数据量成几何级数增加。因此,这样一个处理系统就要求有海量存储设备,同时要求I/O的吞吐能力越高越好。数据量的增加是要求高性能计算的一个方面,只有计算速度加快,才能在短时间内完成数据的处理。另一方面处理方法的改进,进一步增大了对计算速度的要求。
PC-Cluster集群计算机系统的应运而生,使这些已往不能也不敢采用的方法变为现实,同时PC-Cluster系统优越的性价比也使用户由过去望而却步变成了竞相争用的系统。
至成恒业公司深知用户的需求,所以至成恒业公司以成熟的技术、丰富的实施经验、优异的性能价格比完全满足用户对所需的高性能要求。
本方案中计算节点采用1U机架式服务器,存储IO节点,管理节点/登录节点均采用2U机架式服务器,磁盘阵列采用先进的光纤接口磁盘阵列,配置30TB有效容量高性能,高可靠的10000rpm SAS II磁盘,计算网络采用36口 Infiniband高速存储交换机连接。
本系统的计算网络、集群管理网络、存储网络分离,计算网络通过Infiniband高速存储 交换机40Gb/s上行端口接入高性能Infiniband高速存储交换机,并通过并通过2个存储I/O节点共享访问光纤存储;管理网络接入以太网交换机。所有节点,管理设备,网络设备全部放置在42U标准机柜中,统一进行管理,既美观又方便。
如上图所示,本系统由若干个网络和相应软件系统构成:
1、计算网络(40Gb/s Infiniband)
计算网络由计算节点、高速存储交换机Infiniband交换机等硬件组成;
2、管理网络
管理网络由管理服务器、管理网络交换机,等硬件组成;
3、存储系统
存储网络由磁盘阵列、I/O节点服务器等硬件组成。