众所周知,高校有着大量的人才,他们有很强的创造能力和探索能力,有着良好的学术研究氛围,这是优秀的资源。在掌握了相关的知识后,各个学院都 希望通过HPC强大的计算能力计算或模拟实验运算出来的结果,来辅助完成学术和探索方面的研究和证实,这些学术和探索方面的研究课题包括生物计算,基因研究,航空航天,分子动力学,材料化学,计算化学,物理化学,结构力学,流体力学,有限元领域,气象领域,石油勘探等领域。这些课题的研究成果都是高校研究 能力的重要体现。
高校专业学科应用HPC并行计算平台,可以充分利用学校的计算资源,为跟踪和研发最新的科学技术、保持和提高学校的 学 术水平提供良好的硬件基础。这种应用一方面迎合了高校学科对高性能计算的要求,另一方面HPC本身的集群高性价比特点降低了高校总体硬件成本,为高校直接 创造价值,同时推进高校科技创新的步伐。
针对此问题,至成制定出利用先进的计算机技术建设一套完整的高性能计算平台系统,此系统支持动态扩展,在系统性能需要提升时,可以很方便地进行扩展。通过高性能计算平台可以进行高性能计算机资源共享平台建设,供全校师生通过互联网利用高性能计算系统进行高水平科学研究,构建超高速高性能、开放式的共享计算平台,提供安全、高效、方便的运行和使用环境,满足大规模计算的需求。
目前国内多数学校采用单一独立的服务器来承担国家级科研项目,现有系统已无法满足其需求,因学校承担的国家级科研项目众多,高性能计算系统是进行高水平科学研究和学科建设必不可少的基础条件,建立一套高性能计算平台集群系统也将成为必然。
至成恒业高性能计算平台建设构建工程共分为两部分:
(一)计算机硬件系统;
(二)软件管理系统;
针对学校的以上需求,至成恒业采用刀片服务器机箱和刀片服务器来组成作为整个服务器系统的计算部分;采用万兆以太网交换机作为核心计算网络交换机;采用普通机架服务器作为管理节点;采用普通机架服务器作为系统IO节点服;采用千兆以太网交换机作为管理系统交换机;同时采用集群系统管理软件作为整个集群系统的管理调度程序。 整个系统的拓扑图架构如下:
软件部分包括:
操作系统:1套操作系统
集群管理软件:1套集群系统管理软件;
至成建议采用集群管理软件统一部署管理,使其实现以下效果:
? 可视化集群管理
实时性能指标的总体状态显示当前各项。用户可以查看系统当前各项性能指标的总体状态,包括:CPU、内存的利用率,集群负载,网络流量,以及各个主机状态等多项内容。
基于Web的集群数据管理,图形化的配置操作界面。
可任意调度的集群应用管理。登录用户可以查看个人提交作业的实时运行状态信息。用户可以对个人作业进行全面管理,包括提交作业、删除作业、阻塞作业和释放作业等操作
? 面向服务的集群应用模式
基于角色的用户权限。系统管理员可以对系统中不同角色的操作权限进行配置和管理。集群优化管理系统的功能既包括集群系统平台层次的操作管理,也涵盖对各种专业应用的使用和维护。因此,有必要对系统功能权限进行分类管理,以便明确各类角色的责任、权利和义务,更好地为集群用户提供服务。
不同操作系统间的一键式切换。支持一套物理集群安装多种操作系统,并完成多个不同操作系统间的一键式切换灵活的预约服务、资源调度及计费管理功能,可以对集群系统的资源使用情况进行统计,以及基于历史数据对用户资源使用情况进行分析等。
? 高扩展性、兼容性
整个并行计算系统采用第三方集群系统管理软件,兼容所有主流X86架构服务器。系统节点可支持机架式服务器与刀片服务器,支持多种互联方式。
这种由标准的软硬件计算机组件架设起的大规模计算群集系统,成本只有超级计算机的10%,但其性能却接近甚至优于传统的超级计算机,而且还拥有极强的灵活性和可扩展性,从而成为大型企业、研究机构和政府部门执行复杂运算任务的理想选择。
至成高性能计算群集解决方案融合了一系列采用标准技术的服务器硬件设备、各种便于操作的管理软件以及包括售前咨询、设计和售后部署、测试、优化在内的完善的支持服务。高性能计算群集系统使实验室的计算能力获得了显著提升,成为大量并行计算及关键型应用的硬件载体,满足了各个研究部门的独特需求。