训练-数据 问答列表

为什么测试准确率略高于训练准确率?

作者:Muzammil 提问时间:11/25/2022

我正在使用 CNN 运行一个 3 类分类问题,总共有大约 7200 张图像。我使用了 80:20 的分割,精度和损耗曲线与代码一起附上。 有人可以解释为什么验证准确性高于训练,同样训练损失高于验证损...

如何使用预训练的多任务 NLP 模型 - 简化?根据上下文 #based

作者:Magos Xiaomi 提问时间:10/11/2023

因此,假设我在 Colab 上的 GPU 上训练后,在本地本地下载了一些模型* .bin(如 BERT、llama-2)。 我不明白的是以下几点: 该模型在 xy 数据集上进行了预训练,并且能够提供...

ValueError: 'labels.shape' 必须等于 'logits.shape',最后一个维度除外。收到: labels.shape=(4, 72) 和 logits.shape=(4, 70, 50257)

作者:StormVisionary 提问时间:10/24/2023

尝试使用具有 2 列标签(正式和非正式)的 excel 数据表微调 gpt-2 模型时,不断出现此错误。正在制作模型以将正式给定的句子转换为非正式的句子。 训练部分代码如下: 我也尝试了没有稀疏的...

NameError:Python 代码中未定义名称“tokenize_and_split_data”

作者:Gha 提问时间:10/25/2023

我想将数据分为变量。该函数不起作用,库未定义。我正在研究 Python google colab。train_datasettest_datasettokenize_and_split_datauti...

ValueError('max_value 在训练或验证期间不得为零或 nan')

作者:arpita halder 提问时间:10/28/2023

我可以看到max_value是 nan in transforms.py 屏幕截图 2023-10-27 于 10.14.45 PM.png 因此,由于此异常,我得到了一个 ValueError。...

带有 shuffle=False 的数据加载器,但图像顺序在每个纪元中都会发生变化

作者:mor hale 提问时间:11/5/2023

即使我使用图像随机化每个时代。'shuffle=False' 下面是用于创建加载程序的代码: data_set = dset.CIFAR10(root='./data/cifar10', trai...

批量处理还是逐个图像处理?(恐龙V1)

作者:Xanta_Kross 提问时间:11/13/2023

我一直在尝试为个人项目重新创建 Dino V1 训练设置。为此,我从这个存储库中获取了大部分代码:https://github.com/facebookresearch/dino[dinov1 lin...


共7条 当前第1页