使用 Huggingface 数据集,如何将特定特征设置为 numpy 数组,以便在重新加载时它们是 ndarrays?
作者:Jaggz 提问时间:11/8/2023
使用 load_dataset() 加载 Mozilla Common Voice (v11) 数据集时,生成的数据集 (ds) 将 audio.arrays 作为 numpy 数组。我不知道如何重现...
Dataset 问答列表
作者:Jaggz 提问时间:11/8/2023
使用 load_dataset() 加载 Mozilla Common Voice (v11) 数据集时,生成的数据集 (ds) 将 audio.arrays 作为 numpy 数组。我不知道如何重现...
作者:Didlex 提问时间:11/8/2023
当尝试使用 flat_map 方法解压缩特征字典中的子 VariantDatasets 时,我很难理解要解析为 flat_map 方法的函数,以成功获取用于训练的时间序列数据集。 我定义数据集并映射...
作者:vmchance 提问时间:11/3/2023
我一直在尝试在一个非常大的图像数据集(大约 100 万张图像)上使用多种聚类技术。该过程非常标准 - 例如,使用预训练的 CNN(在本例中为 VGG19)来提取特征并测试许多聚类方法(目前是分层和 k...
作者:Justin 提问时间:11/5/2023
我有成批的 3D tf.data.Dataset 用于训练,由于我的主系统需要这种方式,我需要将其拆分为 train_X 和train_Y。我使用以下方法进行拆分,但得到奇怪的结果。有人可以发表评论或...
作者:sindhuja 提问时间:11/3/2023
我正在从事恶意活动检测工作,并正在寻找FDMA 2012竞赛数据集。我在访问它时遇到了困难,因为最初组织比赛的 SMU 已在其网站上将数据集标记为非活动数据集。我也找不到任何 API。我错过了什么吗?...
作者:mahwiz 提问时间:11/2/2023
我在 Kaggle 上遇到了音频处理问题,而相同的代码在 Colab 上没有错误 voices = datasets.map(prepare_dataset, remove_columns=data...
作者:user22830098 提问时间:10/31/2023
有关错误的详细信息我使用 tdfs.load 从 tensorflow_dataset 导入“kddcup”数据集,但是当我运行代码时,代码的执行卡在“生成火车示例...”部分。 我还尝试减小数据集...
作者:Didlex 提问时间:10/27/2023
我正在尝试从 csv 文件中窗口一些数据进行时间序列训练,但是当我从中创建数据集并尝试将其窗口化时:make_csv_dataset() def window_data(self, data_ds,...
作者:G. Lippolis 提问时间:10/29/2023
我正在尝试使用使用“tf.data.Dataset.from_generator”构建的数据集来拟合模型。 但合身失败了。 这里是数据集的代码: cd_gen=CordicDatasetFT(14...
作者:Ivan González 提问时间:10/27/2023
因此,我正在使用 image_dataset_from_directory 方法创建一个张量流数据集。问题是,我想将这个函数返回的 tf.data.dataset 拆分为输入数据 (trainX) 和...