Dataset 问答列表

使用 Huggingface 数据集,如何将特定特征设置为 numpy 数组,以便在重新加载时它们是 ndarrays?

作者:Jaggz 提问时间:11/8/2023

使用 load_dataset() 加载 Mozilla Common Voice (v11) 数据集时,生成的数据集 (ds) 将 audio.arrays 作为 numpy 数组。我不知道如何重现...

tf.data API 'flat_map' 方法,用于在字典中使用 VariantDatasets 在窗口方法后解包

作者:Didlex 提问时间:11/8/2023

当尝试使用 flat_map 方法解压缩特征字典中的子 VariantDatasets 时,我很难理解要解析为 flat_map 方法的函数,以成功获取用于训练的时间序列数据集。 我定义数据集并映射...

在大型数据集上使用提取的特征向量进行图像聚类

作者:vmchance 提问时间:11/3/2023

我一直在尝试在一个非常大的图像数据集(大约 100 万张图像)上使用多种聚类技术。该过程非常标准 - 例如,使用预训练的 CNN(在本例中为 VGG19)来提取特征并测试许多聚类方法(目前是分层和 k...

将 tf.data.Dataset 元组拆分为两个数据集

作者:Justin 提问时间:11/5/2023

我有成批的 3D tf.data.Dataset 用于训练,由于我的主系统需要这种方式,我需要将其拆分为 train_X 和train_Y。我使用以下方法进行拆分,但得到奇怪的结果。有人可以发表评论或...

我在哪里可以获得FDMA竞赛数据集?

作者:sindhuja 提问时间:11/3/2023

我正在从事恶意活动检测工作,并正在寻找FDMA 2012竞赛数据集。我在访问它时遇到了困难,因为最初组织比赛的 SMU 已在其网站上将数据集标记为非活动数据集。我也找不到任何 API。我错过了什么吗?...

无法从<_io加载音频。0x7b01dd5f8b80>处的 BytesIO 对象

作者:mahwiz 提问时间:11/2/2023

我在 Kaggle 上遇到了音频处理问题,而相同的代码在 Colab 上没有错误 voices = datasets.map(prepare_dataset, remove_columns=data...

Tensorflow tfds.load “生成训练示例”循环

作者:user22830098 提问时间:10/31/2023

有关错误的详细信息我使用 tdfs.load 从 tensorflow_dataset 导入“kddcup”数据集,但是当我运行代码时,代码的执行卡在“生成火车示例...”部分。 我还尝试减小数据集...

如何窗口 make_csv_dataset()

作者:Didlex 提问时间:10/27/2023

我正在尝试从 csv 文件中窗口一些数据进行时间序列训练,但是当我从中创建数据集并尝试将其窗口化时:make_csv_dataset() def window_data(self, data_ds,...

如何使用 TensorFlow Dataset.from_generator

作者:G. Lippolis 提问时间:10/29/2023

我正在尝试使用使用“tf.data.Dataset.from_generator”构建的数据集来拟合模型。 但合身失败了。 这里是数据集的代码: cd_gen=CordicDatasetFT(14...

为什么在使用张量流图函数并将其转换为 numpy 数组时,我没有以正确的顺序获得 tf.data.dataset 的标签?

作者:Ivan González 提问时间:10/27/2023

因此,我正在使用 image_dataset_from_directory 方法创建一个张量流数据集。问题是,我想将这个函数返回的 tf.data.dataset 拆分为输入数据 (trainX) 和...


共25条 当前第2页