NLP 问答列表

使用 Rasa 映射大型数据集的常见问题解答 (2000+)

作者:Stev Jane 提问时间:11/3/2018

RASA 由 Rasa NLU + Core 组成,我已经测试过了,我了解它的某些部分。我试着把它放到样本实践中,它工作得很好。 我计划将其提升到一个新的水平,我希望在“tensorflow”后端的...

ValueError: 'labels.shape' 必须等于 'logits.shape',最后一个维度除外。收到: labels.shape=(4, 72) 和 logits.shape=(4, 70, 50257)

作者:StormVisionary 提问时间:10/24/2023

尝试使用具有 2 列标签(正式和非正式)的 excel 数据表微调 gpt-2 模型时,不断出现此错误。正在制作模型以将正式给定的句子转换为非正式的句子。 训练部分代码如下: 我也尝试了没有稀疏的...

在Excel中使用模糊查找进行字符串匹配

作者:Chitwan 提问时间:7/12/2023

我正在尝试使用模糊查找来匹配如下所示的表的两列中的两个字符串。 表1 表2 | Column A | Column B | | -------- | -------- | | Flower.com...

变压器训练损耗不减 - Val. Acc/cy 停留在 0.58

作者:Manuel Gk 提问时间:5/10/2023

我正在训练一个基于 pytorch 的多分支管道,用于 deepfake 检测。我正在尝试实现论文中提出的以下模型: 一种基于Transformer的DeepFake检测方法 用于面部器官 (薛子宇...

在 R 中文本文档的 1 到 5 行内同时出现两个单词列表单词

作者:Mohsin 提问时间:7/26/2023

我想检测单词列表“A”和单词列表“B”的 1 到 5 行内单词的出现频率。列表中的单词由“OR”的布尔运算符分隔,这意味着如果“A”中的任何一个单词出现在“B”中任何单词的上述范围内。 我尝试了各种...

1500 个 ID 中最常见的二元组计数,而不在一个 ID 中重复计数

作者:MfM 提问时间:8/15/2023

我正在尝试计算 1500 个 IDS 中最常见的二元组(每行 1 个 ID,有 1 个事件),而不计算每个 ID(行)中超过 1 倍的二元组。例如,如果我有以下 ID,我只想在每个 ID 中计算 1 ...

获取 RuntimeError:生成器在使用 nltk 模块生成二元组时引发了 StopIteration

作者:gmohor21 提问时间:8/26/2023

我正在尝试使用生成二元组,但出现错误。如何针对我的特定问题修复此错误?nltk.ngramsRuntimeError: generator raised StopIteration 我的数据帧有多列...

在语料库中提取“代表性”(不一定是最常见的)4 克的推荐方法?TF-IDF 或

作者:Vahid 提问时间:9/1/2023

我有一个包含 500 篇研究文章的语料库,我想提取前 4 克,不仅仅是基于最高频率,而是与一般研究文章类型的相关性(该类型的 4 克特征)。 推荐使用 TF-IDF,使用 Scikit-learn,...

如何使用 api 阅读 Gmail?

作者:Kanaparthy Jaswanth 提问时间:9/16/2023

所以我能够把一个代码放在一起,允许我检索过去 48 小时内的未读消息,这要归功于 @LindaLawton-DaImTo。 在这里,我在美化输出(采用 html 格式)时遇到了问题。我试图放一个ht...

使用 NLTK 和 Kneser-Ney 平滑计算条件熵二元组

作者:chasmani 提问时间:9/21/2023

我正在尝试在二元组级别估计文本源的条件熵。为了得到一个好的估计,我需要对二元组的概率进行估计。经过一些阅读,Kneser-Ney 平滑似乎是估计这些概率的最合适方法。 nltk 模块在模块中包括 K...


共66条 当前第6页