pytorch 问答列表

PyTorch load_state_dict() 不加载精确值

作者:Random Seed 提问时间:11/7/2023

为简单起见,我想使用此代码将火炬模型的所有参数设置为常量72114982 model = Net() params = model.state_dict() for k, v in params....

带有 shuffle=False 的数据加载器,但图像顺序在每个纪元中都会发生变化

作者:mor hale 提问时间:11/5/2023

即使我使用图像随机化每个时代。'shuffle=False' 下面是用于创建加载程序的代码: data_set = dset.CIFAR10(root='./data/cifar10', trai...

pytorch transformers BertModel 中的tgt_key_padding_mask

作者:carpet119 提问时间:11/8/2023

在浏览 PyTorch 中的转换器文档时,我看到形状(batch_size、tgt_seq_len)的tgt_key_padding_mask用于表示由于填充而使 tgt 的某些部分无关紧要。当我从 ...

在深度学习量化投资领域,如何对输入特征进行标准化?

作者:Yaohua Guo 提问时间:11/10/2023

当使用深度学习模型进行量化投资时,输入特征在不同维度上可能具有不同的尺度。我们如何标准化这些特征,使模型训练更加稳定,避免计算中的梯度爆炸或nan/inf值等问题? 例如,我们的输入特征是 [最低价...

Torch 分布式绑定端口过多,阻碍 128 进程创建

作者:cangozpi 提问时间:11/10/2023

我正在尝试使用火炬分布式包进行分布式 cpu 训练。在我的代码中,我通过调用 ddp_setup() 初始化和创建组,如下所示: def get_dist_info(): GLOBAL_WORLD...

近端策略优化实现不收敛:离散环境

作者:Bernardo Olisan 提问时间:11/10/2023

我从头开始为离散环境实施了近端策略优化 (PPO)。该算法涉及初始化策略网络、状态值函数和动作值函数(作为神经网络函数近似器)。该过程包括策略推出,其中策略网络和值函数使用梯度下降进行更新,并在每个时...

RuntimeError:预期的 2D(未批处理)或 3D(批处理)输入到 conv1d,但输入大小:[1, 1, 2, 160000]

作者:Yunus Koç 提问时间:11/9/2023

我有一种火炬训练脚本来转录音频文件。我有 2 个音频文件,其中一个有 [1 1 16000]形状,另一个有 [1 1 16000]。两个文件都是 10 秒。我无法处理错误。如果您对音频有所了解,也许会...

有没有办法在不使用 Swift 或 CoreML 的情况下直接在 iPhone 上运行 pytorch?

作者:SupernoobBran 提问时间:11/11/2023

作为标题。 我尝试在 iOS 中使用应用程序,例如构建一个类似 linux 的环境来运行 pytorch(直接训练小型网络而不使用 Swift 等)。但是,无法安装它们。有没有办法让 iPhone ...

为什么在numpy数组中更改从numpy转换而来的张量?

作者:Tavakoli 提问时间:11/12/2023

当我将 numpy 数组转换为张量并以不同的方式更改 numpy 时,有些会更改张量,有些则不会。 在此代码中: array = np.arange(1., 8.) tensor = torch....

使用我自己的自定义数据集进行视频帧插值

作者:itsmebaejae 提问时间:11/12/2023

我想用训练我自己的自定义模型来制作一个 PyTorch 程序。使用 RIFE 预训练模型(链接:文本)有一个很好的程序。但我想将模型替换为我自己的模型,或者微调预训练的数据集。我不知道如何组织自定义模...


共127条 当前第9页