mpiexec 命令在 Python 上运行神经网络,但不打印

mpiexec command running a neural network on Python but not printing

提问人:nico 提问时间:11/6/2023 更新时间:11/6/2023 访问量:9

问:

所以我想使用 mpiexec 命令运行神经网络。

当我使用 mpiexec -n 12 python C:\Users\Usuario\OneDrive\Desktop\Internship\new_es\example_es.py 时,代码运行(根据任务管理器,它正在运行进程),但它不打印任何内容,例如训练进度。运行命令后,它将保持在屏幕截图中。

(https://i.stack.imgur.com/hMdT7.png)

当我只运行 python C:\Users\Usuario\OneDrive\Desktop\Internship\new_es\example_es.py 时,它打印得很好。

这是它正在运行的代码:

'def train_es(): last_t = 时间.time() 对于 Range(1, n_epochs + 1) 中的纪元: 对于 batch_idx,枚举(train_loader) 中的 (data, target): 数据,目标 = data.to(设备),target.to(设备)

        ###
        def eval_fn(model):
            output = network(data)
            loss = F.nll_loss(output, target).cpu().item()
            return loss
        loss = optimizer.step(eval_fn) 
        ###

        if batch_idx % log_interval == 0  and  optimizer.is_master:
            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
              epoch, batch_idx * len(data), len(train_loader.dataset),
              100. * batch_idx / len(train_loader), loss.item()))
            print('\t time: ', time.time()-last_t)
            last_t = time.time()

    if optimizer.is_master:
        print('EVAL at the end of each epoch: ')
        test()  ## Baseline: 98.43%

#torch.save(network.state_dict(), 'model.pth')
#torch.save(optimizer.state_dict(), 'optimizer.pth')

train_es() `

我能为它做些什么来打印进度,因为它应该这样做?

Windows 11,蟒蛇。

Python Windows 深度学习 神经网络 MPI

评论


答: 暂无答案