使用自定义损失函数时，如何在 PyTorch 中执行内存高效的反向传播？-解网

问：

简介：

我正在使用 PyTorch 进行一个大规模的深度学习项目，并在反向传播过程中遇到内存问题。我已经实现了一个自定义损失函数，我需要知道是否有一种更节省内存的方法来执行反向传播，而不会影响自定义损失计算。

代码：

import torch
import torch.nn as nn

class CustomLoss(nn.Module):
    def forward(self, x, y):
        return torch.sum(x * y)

# My neural network
class Net(nn.Module):
    # ...

我尝试使用 PyTorch 的内置方法进行反向传播，但它们会消耗大量内存。我原以为可以优化自定义损失函数以提高内存利用率。

到底发生了什么？

在反向传播期间，内存消耗激增，导致我的脚本崩溃。

Python PyTorch 反向传播

使用自定义损失函数时，如何在 PyTorch 中执行内存高效的反向传播？

How to Perform Memory-efficient Backpropagation in PyTorch When Using a Custom Loss Function?

评论