HuggingFace 问答列表

Atrribute 错误:“AlignConfig”对象没有属性“encoder”,“PoolFormerConfig”对象没有属性“encoder”

作者:Priya Savithiri Baskaran 提问时间:11/9/2023

我正在使用** python==3.10, torch==1.13.0+cpu, transformers==4.35.0.** 我正在尝试使用以下命令对 pytorch 框架中的转换器模型进行 (c...

“enforce_stop_tokens”如何在LangChain中使用Huggingface模型?

作者:alvas 提问时间:6/15/2023

当我们查看 HuggingFaceHub 模型的使用情况时,有一部分作者不知道如何停止生成,https://github.com/hwchase17/langchain/blob/master/lan...

使用 Huggingface 数据集,如何将特定特征设置为 numpy 数组,以便在重新加载时它们是 ndarrays?

作者:Jaggz 提问时间:11/8/2023

使用 load_dataset() 加载 Mozilla Common Voice (v11) 数据集时,生成的数据集 (ds) 将 audio.arrays 作为 numpy 数组。我不知道如何重现...

我在哪里可以获得FDMA竞赛数据集?

作者:sindhuja 提问时间:11/3/2023

我正在从事恶意活动检测工作,并正在寻找FDMA 2012竞赛数据集。我在访问它时遇到了困难,因为最初组织比赛的 SMU 已在其网站上将数据集标记为非活动数据集。我也找不到任何 API。我错过了什么吗?...

无法从<_io加载音频。0x7b01dd5f8b80>处的 BytesIO 对象

作者:mahwiz 提问时间:11/2/2023

我在 Kaggle 上遇到了音频处理问题,而相同的代码在 Colab 上没有错误 voices = datasets.map(prepare_dataset, remove_columns=data...

拥抱脸:无法在 kaggle 上使用 Seq2SeqTrainer 找到调谐 Whisper

作者:Xanta_Kross 提问时间:10/24/2023

我复制了这个 kaggle 笔记本:https://www.kaggle.com/code/imtiazprio/fast-whisper-large-v2-fine-tuning-with-lora...

在增加词汇量后,DistilBert 标记化不会在单词内标记的开头添加磅 (##)

作者:Carlos Muradyan 提问时间:10/17/2023

我正在用来自新语料库的新令牌来丰富 DistilBert tokenizer。 使用分词器,并基于 Huggingface NLP 课程,通过从单词开头找到“尽可能长的标记”,将其拆分,然后对单词的其...

替换分词器中的特殊 [unusedX] 标记,以在基于 Bert 的模型中添加特定于域的单词 - huggingface

作者:Carlos Muradyan 提问时间:10/17/2023

假设我有特定于域的单词,我想将其添加到我用于进一步微调模型的分词器中。BERT 的 Tokenizer 是具有 [[unusedX] tokens] 的 tokenizer 之一。添加新令牌的方法之一...

确定最有用的特定于域的令牌,以添加到 huggingface 转换器中的现有标记器

作者:Carlos Muradyan 提问时间:10/17/2023

我正在使用一个模型,使用huggingface转换器在医疗领域执行令牌分类任务。不幸的是,我没有足够的数据来设置新的分词器并从头开始训练新模型,所以我正在使用现有的基于 bert 的模型并对其进行微调...

在 python CGI 脚本中激活 venv 虚拟环境时出现 ModuleNotFoundError

作者:Liesel_Weppen 提问时间:9/15/2023

我刚刚开始使用 huggingface transformers 库,并一直在通过 Pytorch 和 venv 对其进行试验。 如果我从 shell 激活 venv 虚拟环境,它就可以正常工作。 ...


共20条 当前第2页