HPC简介

 

产品简介

更新时间 2020-02-28

HPC 高性能计算是山河推出的一站式超算平台,提供弹性和可扩展的HPC计算资源,是传统HPC技术与云计算技术的融合升级。提供丰富多样的使用模式适配多种应用场景,统一的管理系统提供最优的使用体验,工程师、研究人员可以突破本地 HPC 基础设施限制,快速开始设计创新。

产品介绍

HPC 高性能计算(High Performance Computing)通常指将计算能力汇集,用并行计算方式解决更大规模的科学,工程和商业问题。HPC可以用于各种行业的计算密集型的计算任务。例如机器学习、深度学习和自动驾驶等新兴应用,基因组学、计算化学、金融风险建模、计算机辅助工程、天气预报和地震成像等传统HPC应用。

功能概述

HPC 提供全生命周期的高性能计算服务,从集群创建/管理到扩容/删除,从作业的创建/管理到结果的输出和预览,从软件的安装/使用到卸载,及众多的管理功能,如用户管理、监控、日志、远程登录等。

集群

HPC 集群由多种类型的节点组成,包括:管控节点,计算节点,登录节点,GPU 桌面节点,所有的节点组成了集群。HPC集群是所有管理操作的基础,所有的操作最终都需要落到集群中生效。

作业管理

作业是用户在HPC集群中提交的一个任务,任务在HPC 集群的计算节点中运行,并输出结果。集群会对其中的作业进行统一的调度管理。

作业

高性能计算的作业管理系统会根据一个集群上的可用计算节点的计算资源管理和调度所有计算作业。作业管理系统可以根据用户的需求,统一管理和调度集群的软硬件资源,保证用户作业公平合理地共享集群资源,提高系统利用率和吞吐率。

作业模版

高性能计算提供了作业模板相关的创建模板、删除模板、编辑模板等功能,用户可通过作业模板管理功能,快速创建作业。作业模版是您在作业的创建配置完成后,提供将高频使用的配置信息按模版形式保存,方便您多次使用,提高工作效率。

资源管理

高性能计算的资源包括节点,队列,文件存储NAS及用户管理。

节点

用户可以给登录节点绑定公网IP,用户可以通过绑定后的公网IP访问登录节点,并可以通过sftp实现本地大作业文件到共享NAS存储的上传和下载。

队列

队列由集群中的计算节点组成,可以承接来自不同用户提交的作业,负责对不同作业实施调度及管理调度策略。

文件存储NAS

HPC 支持集群内部采用统一的文件存储,所有的节点拥有同样的文件目录,便于并行执行同一个任务。

用户管理

用户是集群节点中的用户,可以通过密码登录到节点中,具有相应的权限,控制台上支持新增用户、修改用户权限、重置用户密码和删除用户等功能。

操作日志

对HPC集群、作业等操作均记录操作日志,出现问题时可以结合操作日志进行排查。

这篇文档解决了您的问题吗?
0
0