停用词 问答列表

NLTK 如何删除常用词汇,而不仅仅是停用词?

作者:ShoutOutAndCalculate 提问时间:10/29/2023

NLTK 可用于删除非索引字。从字符串中删除常用词(及其复数版本)的技术 但是,是否有包含“近”、“科学”等“常用词”的库,从而选择“吸引子”等“不常用词”?...

是否有任何现有的 stop-ngrams 词汇表?

作者:Vincent 提问时间:11/3/2023

Github 中有几个英文停用词存储库。但是,是否有任何停止 2 克或停止 3 克或停止 4 克?我想从从庞大的语料库生成的 ngram 列表中删除 stop-ngrams。 我没有搜索到任何现有数...

如何使用nltk下载非索引字时解决此错误

作者:Hasitha Gorrepati 提问时间:11/8/2023

导入 NLTK nltk.download('非索引字') 从 nltk.corpus 导入非索引字 stop_words = set(stopwords.words(“英语”)) 我在 kagg...

nltk 下载问题 - 我尝试下载 nltk 工具包的停用词,但此错误不断出现 [重复]

作者:Vaibhavy Raghuvanshi 提问时间:11/14/2023

这个问题在这里已经有答案了: 从 python shell 下载数据时出现错误 (urlopen) (nltk) (2 个答案) 6天前关闭。 我输入这个来下载停用词 然后我收到这个错误 请帮帮我...


共14条 当前第2页