曙光高性能计算在高性能计算中心的应用
- +1 你赞过了
基本硬件环境
高性能计算中心的建设是一个复杂的系统工程,绝不仅仅是采购一台高性能计算机。从阶段上划分,高性能计算中心的建设包括前期的调研和可行性研究,中期的设备选型、基础设施改造、项目招标及实施,以及后期的系统运维和运营。其中比较重要的部分包括系统的基础设施的改造、高性能计算机的选型和采购,以及后期的运维。基础设施的改造主要包括电力改造、空调改造、机房装修等方面的工作,是高性能计算机稳定运行的基础;高性能计算机是计算中心的核心设备,必须具有通用的架构、良好的扩展性、强大的性能、灵活的资源调度、易于使用和管理等;正如汽车要经常保养才能保证行车安全,一台运转良好的高性能计算机不仅仅依赖于硬件的规划和设计,更依赖于后期的运维和管理,相关的运维制度的建立和人员队伍的建设是非常重要的。
曙光高性能计算中心的核心硬件系统采用集群架构,主要包括高性能计算节点、存储和I/O系统、高速系统互连网络等几个部分。系统整体架构图如下:
高性能计算节点部分主要包括刀片集群、SMP计算节点,系统的峰值运算能力可达到1000TFlops以上;所有节点之间以高速Infiniband/万兆以太网络相连,以保证并行计算时节点之间高速通信的要求,最大通信带宽可达56Gb;同时采用千兆以太网络作为管理网络,形成双网冗余、互为备份;存储系统采用主流的SAN光纤架构,通过多个IO节点,共同构建并行文件系统,为用户提供海量存储空间,可扩展到1000TB以上。
系统软件环境
服务器、网络和存储等底层硬件为高性能计算搭建了一个可靠的平台,在此基础上,曙光集群系统的软件堆栈可分为系统软件层、集群操作系统层和应用层。曙光高性能计算机配置了全面完整的软件系统环境,包括操作系统、编译器、调试器、函数库、并行通信库等基础软件,以及曙光公司专门为业内高级用户开发的Gridview2.5综合监控管理系统以及PowerConf智能功耗控制系统软件。
系统软件环境
系统软件层包括操作系统、编译器、调试器、函数库等系统工具。操作系统主要支持Linux和Windows两种。Linux是高性能计算的首选平台,得到了大部分应用软件的支持。曙光公司支持RedHat、SUSE、CentOS等主要的Linux发行版。Linux操作系统上可以支持大量的编译器(如GNU、Intel、PGI等)、调试器(如GDB、DDD等)、函数库(如BLAS、LAPACK、PETSC等);尤其可贵的是,Linux平台下有大量的Open Source的应用软件,可供广大科研人员借鉴和使用。Windows是最为熟悉的操作系统,在Windows下进行高性能计算的需求十分迫切。微软最新发布的WHS 2008即是专为高性能计算而设计的,其中集成了MPI,作业调度,系统监控等组件,让用户所有的任务都可以在WHS中完成。曙光公司和微软公司就WHS签署了合作备忘录,共同推动“高性能计算平民化”的实现。
集群操作系统层包括集群部署、管理、监控、调度、批量操作等工具。集群操作系统层的主要功能是为用户屏蔽底层的硬件特性,使多个节点对用户表现为单个节点,用户只需要通过集群操作系统,就可以实现对整个集群的控制。
曙光Gridview服务器综合管理系统是继承曙光DCMM2、DCAS等监控管理产品的主要功能和技术特色,并增加多项优秀功能开发而成的集群监控管理系统产品。曙光Gridview服务器综合管理系统提供了统一的集中式监控平台Portal,具备可扩展性、集成性、可靠性和易用性,提供了对各种商用、自己研发的管理工具的集成接口,从而满足同时对各不同厂家大型机的环境、硬件、软件等各方面进行监控管理的需求,是业界最为领先的商用管理软件平台。
应用层是用户接触最多的部分。一个配置完善的集群,对于用户而言,实际上不需要了解底层的运行机制,只需要关注自己领域的应用软件。曙光集群支持各个应用领域的各种应用,只要应用软件有支持x86处理器和Linux/Windows操作系统的版本,就可以在曙光集群上运行。
目前已经在曙光集群上成功运行的各领域软件有:
石油领域:Geoeast、Paradigm、CGG、Omega等
气象领域:MM5、Grapes、WRF等
流体力学:Fluent、CFX、Star-CD、Powerflow等
结构力学:Ansys、Nastran、Abaqus、Ls-dyna等
计算化学:VASP、Gaussian、Material Studio、NAMD等
生物计算:BLAST、FASTA、MEME等
动画渲染:Maya、3DS Max、Lightwave等
GridView作业调度中间件支持应用Web Portal功能,支持VASP、Gaussian、Gromacs、Namd、Ansys、Lsdyna、Abaqus、Fluent等主流科学计算应用的Web作业提交功能,用户使用非常方便,也为高性能计算中心对外开展云计算服务提供了支持。曙光公司可以协助用户完成应用程序的并行部署和运行,并提供对系统配置和应用程序的优化。
最新资讯
热门视频
新品评测