HuggingFace知识经验-第2页-解网

作者：Priya Savithiri Baskaran 提问时间：11/9/2023

我正在使用** python==3.10， torch==1.13.0+cpu， transformers==4.35.0.** 我正在尝试使用以下命令对 pytorch 框架中的转换器模型进行（c...

作者：alvas 提问时间：6/15/2023

当我们查看 HuggingFaceHub 模型的使用情况时，有一部分作者不知道如何停止生成，https://github.com/hwchase17/langchain/blob/master/lan...

作者：Jaggz 提问时间：11/8/2023

使用 load_dataset（）加载 Mozilla Common Voice （v11）数据集时，生成的数据集（ds）将 audio.arrays 作为 numpy 数组。我不知道如何重现...

作者：sindhuja 提问时间：11/3/2023

我正在从事恶意活动检测工作，并正在寻找FDMA 2012竞赛数据集。我在访问它时遇到了困难，因为最初组织比赛的 SMU 已在其网站上将数据集标记为非活动数据集。我也找不到任何 API。我错过了什么吗？...

作者：mahwiz 提问时间：11/2/2023

我在 Kaggle 上遇到了音频处理问题，而相同的代码在 Colab 上没有错误 voices = datasets.map(prepare_dataset, remove_columns=data...

作者：Xanta_Kross 提问时间：10/24/2023

我复制了这个 kaggle 笔记本：https://www.kaggle.com/code/imtiazprio/fast-whisper-large-v2-fine-tuning-with-lora...

作者：Carlos Muradyan 提问时间：10/17/2023

我正在用来自新语料库的新令牌来丰富 DistilBert tokenizer。使用分词器，并基于 Huggingface NLP 课程，通过从单词开头找到“尽可能长的标记”，将其拆分，然后对单词的其...

作者：Carlos Muradyan 提问时间：10/17/2023

假设我有特定于域的单词，我想将其添加到我用于进一步微调模型的分词器中。BERT 的 Tokenizer 是具有 [[unusedX] tokens] 的 tokenizer 之一。添加新令牌的方法之一...

作者：Carlos Muradyan 提问时间：10/17/2023

我正在使用一个模型，使用huggingface转换器在医疗领域执行令牌分类任务。不幸的是，我没有足够的数据来设置新的分词器并从头开始训练新模型，所以我正在使用现有的基于 bert 的模型并对其进行微调...

作者：Liesel_Weppen 提问时间：9/15/2023

我刚刚开始使用 huggingface transformers 库，并一直在通过 Pytorch 和 venv 对其进行试验。如果我从 shell 激活 venv 虚拟环境，它就可以正常工作。 ...