提问人:Mike Nathas 提问时间:9/5/2019 最后编辑:Mike Nathas 更新时间:9/5/2019 访问量:2106
更改 RUNNING Slurm 作业的 CPU 计数
Change CPU count for RUNNING Slurm Jobs
问:
我有一个 SLURM 集群和一个正在运行的作业,我在其中请求了 60 个线程
#SBATCH --cpus-per-task=60
(我正在使用 cgroups 在节点上共享线程)
我现在想将线程数减少到 30 个。
$ scontrol update jobid=274332 NumCPUs=30
Job is no longer pending execution for job 274332
该作业仍分配了 60 个线程。
$ scontrol show job 274332
JobState=RUNNING Reason=None Dependency=(null)
NumNodes=1 NumCPUs=60 NumTasks=1 CPUs/Task=60 ReqB:S:C:T=0:0:*:*
如何实现这一点的正确方法?
谢谢!
答:
5赞
damienfrancois
9/5/2019
#1
在当前版本的 Slurm 中,只允许减少分配给正在运行的作业的节点数,而不允许减少 CPU(或内存)的数量。scontrol
FAQ说道:
使用 scontrol 命令通过为作业指定新节点计数 (NumNodes=) 或标识希望作业保留的特定节点 (NodeList=) 来更改作业的大小。
(强调我的)
评论