停用词 问答列表

PHP: MATCH AGAINST 不适用于某些停用词,但适用于其他停用词(没有明显的逻辑)

作者:Bepe 提问时间:10/1/2021

我正在我的计算机上使用 WAMP 作为可搜索的数据库,该数据库利用如下所示的 MySQL 查询: SELECT * FROM table_name WHERE MATCH (field_01, fi...

从文本文件中删除停用词/连接词

作者:Katie Cook 提问时间:5/15/2023

我正在开发一个程序,该程序读取文本文件并按升序显示前 10 个最常用的单词并打印它们。我已经定义了停用词/连接词并编写了代码以将它们从常用词分析中删除,但是,停用词仍然包含在分析中。 % Print...

在 R 中进行自然语言处理时保留某些停用词

作者:wisamb 提问时间:5/20/2023

我正在使用下面的代码在 R 中进行自然语言处理。我注意到删除停用词的行,删除了“不”这个词。我可以让它保留这个词吗?有没有办法查看它删除的所有单词? # Pre-processing chain c...

主题模型 LDA:删除特殊字符时出现的问题

作者:Frieda 提问时间:5/16/2023

我想从我的简单语料库中删除特殊字符。不幸的是,它在我的情况下不起作用。我尝试了 .此外,我尝试从我的 R 对象复制破折号。我使用XML数据,并在一个简单的语料库中对其进行更改。为此,我使用了.—gsu...

将爱沙尼亚语添加到 solr 8.1 时出错

作者:Nitish Raj 提问时间:5/31/2023

我正在尝试在solr中添加爱沙尼亚语,但它给出了错误分析:org.apache.solr.common.SolrException:org.apache.solr.common.SolrExcepti...

从 pandas 数据帧中删除特定单词

作者:Popeye 提问时间:6/23/2023

示例表: 一个 锐龙CPU,锐龙5 5600X,最佳,AMD 锐龙,销售 中央处理器,Ryzen 9 7800X,可用,Ryzen 电脑,全新 df = pd.DataFrame({'a' : ['...

删除停用词也会在频率分布期间删除单词之间的空格

作者:Alexander 提问时间:7/23/2023

我希望从文本中删除非索引字以优化我的频率分布结果 我的初始频率分布代码是这样写的: # Determine the frequency distribution from nltk.tokeni...

“enforce_stop_tokens”如何在LangChain中使用Huggingface模型?

作者:alvas 提问时间:6/15/2023

当我们查看 HuggingFaceHub 模型的使用情况时,有一部分作者不知道如何停止生成,https://github.com/hwchase17/langchain/blob/master/lan...

从 NLTK 非索引字中排除否定词

作者:Shadi Farzankia 提问时间:8/18/2023

我想从我的句子中删除 nltk 停用词,但具有负面含义的停用词除外,例如:不、不、不能等。换句话说,我想从非索引字列表中排除否定词。我该怎么做?...

如何解决 [nltk_data] 加载非索引字时出错:<urlopen 错误 [WinError 10060]

作者:Ashutosh Bhoi 提问时间:9/28/2023

无法执行代码: nltk.download('stopwords') import nltk #it worked fine nltk.download('stopwords') 它返回以...


共14条 当前第1页