本文主要介绍以下内容
多队列调度的应用背景和应用场景
E-HPC 支持多队列调度的功能实现
介绍各种 HPC 调度器类型对队列和节点组是如何配置管理的
介绍如何通过 OpenApi 的方式调用 E-HPC 多队列调度相关功能
前言
传统的 HPC 本地集群迁云过程中, 部分会采用混合云的模式, 例如如下模式,
云上计算资源规格可能是和本地的计算节点规格不一样, 这就导致单个集群里需要支持多种规格的计算资源, HPC 集群一般会用不同队列 (job queue) 或者节点组 (node group) 来管理不同规格的节点, 然后分发作业到不同的队列以达到区分云上作业和本地作业;
有客户有需求在一个 E-HPC 集群里面运行不同类型作业, 每种类型的作业对资源的需求是不同的, 例如前处理作业需要普通 8 核 32GiB 内存的 ECS 虚拟机, 后端计算性任务需要使用裸金属服务器.
E-HPC 支持多队列
E-HP
来源: https://yq.aliyun.com/articles/717221