slurm 作业管理系统常用命令 srun

时间:2024-03-09 09:52:18

交互式作业提交命令 srun

交互式提交作业:在 shell 窗口中执行 srun 命令,主要命令格式如下:

srun [options] program

srun 常用选项:srun 包括多个选项,其中最常用的选项主要有以下几个:

-n, –ntasks=number

    指定要运行的任务数。请求为 number 个任务分配资源,默认为每个任务一个处理器核。

-c, –cpus-per-task=ncpus

    告知资源管理系统控制进程,作业的每个任务需要 ncpus 个处理器核。若未指定此选项,则控制进程默认为每个任务分配一个处理器核。

-N, –nodes=minnodes[-maxnodes]

    请求为作业至少分配 minnodes 个结点。调度器可能觉得在多于 minnodes 个结点上运行作业。可以通过 maxnodes 限制最多分配的结点数目(例如“-N 2-4”或“–nodes=2-4”)。最少和最多结点数目可以相同以指定特定的结点数目(例如, “-N 2”或“–nodes=2-2” 将请求两个且仅两个结点)。分区的结点数目限制将覆盖作业的请求。如果作业的结点限制超出了分区中配置的结点数目,作业将被拒绝。 如果没有指定-N,缺省行为是分配足够多的结点以满足-n 和-c 参数的需求。在允许的限制范围内以及不延迟作业开始运行的前提下,作业将被分配尽可能多的结点。

-p, –partition=partition name

    在指定分区中分配资源。请使用 -p [hpxg|hpib|debug] 指定所使用的分区。

示例:在CPU-Small分区单节点单核运行chart.e程序
srun -N 1 -n 1 -p CPU-Small ./chart.e