slurm 问答列表

SLURM 报告的内存消耗

作者:Raphael 提问时间:10/26/2023

我正在尝试了解一个简单的作业消耗了多少内存(基于这个python脚本)。我在分配了不同内核数的单个工作线程上运行相同的脚本。 这个小测试的结果是: $ sacct -j 875,876,877,8...

查找运行 PSQL 服务器的 SLURM 节点

作者:Liuka 提问时间:11/2/2023

我有以下问题: 我可以通过 SSH 连接到运行 Red Hat Enterprise Linux 7 的 SLURM 集群,但是每次连接时,我都会被分配一个不同的登录节点。从任何登录节点,我都可以启...

如何为用户保留作业,以便在 slurm 中不达到总 cpu 数?

作者:Jason M Gray 提问时间:11/9/2023

我正在提交一堆数组作业 4 组,每组 5 个,每个 8 个 cpu,所以 4x5x8=160 个 cpus。我想将运行量保持在 100>2x5x8+1x2x8 cpus 总量以下,因为我需要让其他人运...

Slurm 错误:saveRDS(fit, paste(“outputs3/fit_”, mod, “.rds”, sep = “”)) 中的错误:写入连接时出错

作者:megsruppUNBC 提问时间:11/12/2023

我有一个正在尝试运行的批处理脚本。我对原始脚本进行了一些更改(成功运行并保存),因此我想重新运行模型并保存到不同的输出文件夹。我现在在某些模型中出现以下错误,但在其他模型中没有。大约一半的模型成功保存...

将 FP 异常陷阱 (-ffpe-trap/-fpe0) 用于链接到 SIGFPE 不安全库 (libxml2) 的代码

作者:H. Weirauch 提问时间:11/15/2023

我有 Fortran 代码,我想为此启用浮点异常捕获(按照编译器手册页的建议)。但是当我这样做时,二进制文件将不再在 Slurm 队列中运行。 问题显然位于(Slurm 的运行时依赖项,它为 MPI...


共15条 当前第2页