训练-数据知识经验-解网

作者：Muzammil 提问时间：11/25/2022

我正在使用 CNN 运行一个 3 类分类问题，总共有大约 7200 张图像。我使用了 80：20 的分割，精度和损耗曲线与代码一起附上。有人可以解释为什么验证准确性高于训练，同样训练损失高于验证损...

作者：Magos Xiaomi 提问时间：10/11/2023

因此，假设我在 Colab 上的 GPU 上训练后，在本地本地下载了一些模型* .bin（如 BERT、llama-2）。我不明白的是以下几点：该模型在 xy 数据集上进行了预训练，并且能够提供...

作者：StormVisionary 提问时间：10/24/2023

尝试使用具有 2 列标签（正式和非正式）的 excel 数据表微调 gpt-2 模型时，不断出现此错误。正在制作模型以将正式给定的句子转换为非正式的句子。训练部分代码如下：我也尝试了没有稀疏的...

作者：Gha 提问时间：10/25/2023

我想将数据分为变量。该函数不起作用，库未定义。我正在研究 Python google colab。train_datasettest_datasettokenize_and_split_datauti...

作者：arpita halder 提问时间：10/28/2023

我可以看到max_value是 nan in transforms.py 屏幕截图 2023-10-27 于 10.14.45 PM.png 因此，由于此异常，我得到了一个 ValueError。...

作者：mor hale 提问时间：11/5/2023

即使我使用图像随机化每个时代。'shuffle=False' 下面是用于创建加载程序的代码： data_set = dset.CIFAR10(root='./data/cifar10', trai...

作者：Xanta_Kross 提问时间：11/13/2023

我一直在尝试为个人项目重新创建 Dino V1 训练设置。为此，我从这个存储库中获取了大部分代码：https://github.com/facebookresearch/dino[dinov1 lin...