Torch 分布式绑定端口过多,阻碍 128 进程创建
作者:cangozpi 提问时间:11/10/2023
我正在尝试使用火炬分布式包进行分布式 cpu 训练。在我的代码中,我通过调用 ddp_setup() 初始化和创建组,如下所示: def get_dist_info(): GLOBAL_WORLD...
深度 问答列表
作者:cangozpi 提问时间:11/10/2023
我正在尝试使用火炬分布式包进行分布式 cpu 训练。在我的代码中,我通过调用 ddp_setup() 初始化和创建组,如下所示: def get_dist_info(): GLOBAL_WORLD...
作者:fahd 提问时间:11/10/2023
我一直在尝试在集群计算机系统上运行我的神经网络训练。我得到了一个有 128 个内核的节点。我想并行运行 4 个训练,每次一次使用 32 个内核。我曾经假设 TensorFlow 会自行处理并行化,就像...
作者:Sshawarma 提问时间:10/22/2023
背景: 我按照这两个视频中的解释在CNN中进行反向传播。 https://www.youtube.com/watch?v=Pn7RK7tofPg&t=703 https://www.youtube....
作者:user3116857 提问时间:11/11/2023
我正在运行 YOLOv8 的推理 (C++) 示例,您可以在官方存储库中找到该示例。它在 CPU 上工作正常(速度慢),但它正确地绘制了框,没有使用 GPU,它保持在 0%。 当我将其更改为 GPU...
作者:erfan momeni 提问时间:11/12/2023
我想训练 rnn 模型(gru+lstm) 我的训练模型有 500000 个英文文本,我想用这些数据训练和评估模型。当我检查批量大小为 20 的一个 epoch 的训练时间时,它真的很高(6 小时) ...
作者:user3768070 提问时间:11/12/2023
我有一个关于在 Kaggle 上训练我的 CNN 模型的询问。我的数据集包括大约 14,000 张图像。最初,当我开始训练时,我的模型的准确率从 0.5 开始。然而,通过反复训练和执行,准确率提高到0...
作者:Random guy 提问时间:11/11/2023
我从 braze 帐户发送时遇到深度链接问题。深度链接应该为我打开一些,比如说应用程序中的弹出窗口。当应用程序关闭并且我从 Braze 发送推送通知时,我将在我的 ios 移动设备上收到它,当我单击它...
作者:slastine 提问时间:11/13/2023
我正在使用 Keras 来处理单词嵌入,试图从另一个单词嵌入中预测一个单词嵌入。输入由单词嵌入列表组成,输出由与第一个单词嵌入匹配的单词嵌入列表组成。 虽然我的神经模型预测了单个单词的一致结果,但这...
作者:M. R. M. 提问时间:11/13/2023
我安装了WhatsApp(版本2.23.23.78)和多个帐户,一个用于个人帐户,另一个用于企业帐户 我正在从我自己的 react native 应用程序深度链接到 WhatsApp,如下所示: ...
作者:Xanta_Kross 提问时间:11/13/2023
我一直在尝试为个人项目重新创建 Dino V1 训练设置。为此,我从这个存储库中获取了大部分代码:https://github.com/facebookresearch/dino[dinov1 lin...