使用 qsub 和 slurm 获取信息并请求资源

Getting info on and requesting resources with qsub and slurm

提问人:21kondav 提问时间:7/17/2023 最后编辑:21kondav 更新时间:7/17/2023 访问量:16

问:

从本质上讲,可以选择两个计算集群来运行我的程序,一个用于学生,一个用于研究人员。我正在处理的代码用于诊断实验结果,因此我需要能够同时使用两者。grad 集群使用 slurm,研究集群使用 qsub。

第一个问题:

grad 集群的组成并不统一,一些节点具有截然不同的处理器。对于我的特定用途,我需要 Fuse Multiply Add。 您如何在 slurm 中请求具有某些属性/指令的 cpu(qsub 不需要这个,但知道会很有用)

第二个问题:

我用于测试程序的脚本当前调用一个命令 (pytest),该命令设置为需要输入正在使用的节点数和 cpu 数。我希望能够获取节点数和每个节点的内核数,以便用户在运行测试时不必编辑脚本。如何从 qsub 和 slurm 获取此信息?目前,我没有 slurm 的解决方法,而对于 qsub,我有一个 python 脚本,它获取一行包含信息,该信息被解析为信息。

谢谢!

SLURM HPC QSUB

评论


答: 暂无答案