torch 问答列表

pytorch 3D 张量切片与列表仅在列表中有一个值或一个 True 值时才有效

作者:puddles 提问时间:9/5/2023

我有一个 3d 张量,我想使用 .是否要屏蔽某行取决于布尔列表,其 True 值对应于要屏蔽的行。当列表中有一个 True 时,下面的代码按预期工作,但当有两个 True 时会给出一个 IndexEr...

ValueError:将数据切片到训练和验证时,0 不在范围内

作者:user17230397 提问时间:5/14/2023

这是从磁盘加载的数据 wt_emb = torch.load("train/train_wt.pt") mut_emb = torch.load("train/train_mut.pt") df =...

detectron2 运行正常,但 tensormask 一直显示 RuntimeError: Not compiled with GPU support

作者:bluesky487 提问时间:11/17/2023

对不起,我的英语不好。 我的操作系统是 WIN11,我使用 Anaconda 创建了一个虚拟环境,python 版本是 3.8.18,并使用 conda install pytorch==1.10....

torch.distributed.get_world_size() 和 torch.cuda.device_count() 返回不同的数字,出现无效的设备序号错误

作者:DLS 提问时间:11/4/2023

我正在尝试在 pytorch 中的多个 GPU 之间使用张量并行化,特别是 2 个 Nvidia A100,以使用基于 slurm 的 HPC 将一个 GPU 太大的模型传播到多个 GPU 中。我的模...

Pytorch - 向后使用复数

作者:computational_scientist 提问时间:11/7/2023

我有复杂的数据,我想用它来训练火炬中的网络。 我已经设法创建了一个网络和所有张量。 但是,一旦我开始训练,就会收到以下错误:grad can be implicitly created only f...

使用我自己的自定义数据集进行视频帧插值

作者:itsmebaejae 提问时间:11/12/2023

我想用训练我自己的自定义模型来制作一个 PyTorch 程序。使用 RIFE 预训练模型(链接:文本)有一个很好的程序。但我想将模型替换为我自己的模型,或者微调预训练的数据集。我不知道如何组织自定义模...

遍历 Dataloader 时卡住

作者:JIAZHENG HU 提问时间:11/13/2023

我正在尝试创建一个包含 10000 个样本(8000 个用于训练,2000 个用于验证)的 3D 测试数据集来测试我的 3D CNN 模型。看起来一切正常,直到我尝试查看我使用的第一批数据。更具体地说...

批量处理还是逐个图像处理?(恐龙V1)

作者:Xanta_Kross 提问时间:11/13/2023

我一直在尝试为个人项目重新创建 Dino V1 训练设置。为此,我从这个存储库中获取了大部分代码:https://github.com/facebookresearch/dino[dinov1 lin...

如何在 Docker 容器中的不同 CUDA 版本上运行深度学习框架

作者:MUNSpirit 提问时间:11/13/2023

我有以下问题:我在 PyTorch 中开发了一个深度学习管道(但 Tensorflow 也存在这个问题),它适用于我的 GPU 和 CUDA 版本的计算机。没关系。但是现在我希望其他人使用他们的 GP...

Torch 分布式绑定端口过多,阻碍 128 进程创建

作者:cangozpi 提问时间:11/10/2023

我正在尝试使用火炬分布式包进行分布式 cpu 训练。在我的代码中,我通过调用 ddp_setup() 初始化和创建组,如下所示: def get_dist_info(): GLOBAL_WORLD...


共132条 当前第2页