节点管理
HPC 集群由多种类型的节点组成,包括:管控节点,计算节点,登录节点,GPU 桌面节点,所有的节点组成了集群
节点角色
- 管控节点:为集群提供统一的作业调度服务和域账户管理服务
- 计算节点:执行高性能计算作业的节点
- 登录节点:用户可远程登录该节点,通过命令行操作EHPC集群(如:job 提交),用户还可以在该节点上自定义软件编译安装
- 桌面节点:为用户提供可视化服务,用户可以通过可视化节点预览查看作业结果
一般来说,管控节点只处理作业调度和帐户信息,不直接参与作业运算,因此管控节点选用较低配置的企业级实例保证高可用性即可。
计算节点的硬件配置选择决定了集群的计算性能。
登录节点通常会被配置为开发环境,需要为集群所有用户提供软件开发调试所需的资源及测试环境,因此推荐登录节点选择与计算节点配置一致或内存配比更大的实例。
节点管理
集群节点可以在集群详情页面或者在节点页面查看。
在节点页面可以切换到不同的集群查看
在节点页面,鼠标右键点击节点,可以修改节点的名称,也可以绑定/解绑公网IP
新增节点
在创建HPC集群过程中,可以选择集群节点的规格和数量
也可以选择为已有集群增加节点
节点监控
在节点页面,可以点击查看监控信息