NLTK 如何删除常用词汇,而不仅仅是停用词?
作者:ShoutOutAndCalculate 提问时间:10/29/2023
NLTK 可用于删除非索引字。从字符串中删除常用词(及其复数版本)的技术 但是,是否有包含“近”、“科学”等“常用词”的库,从而选择“吸引子”等“不常用词”?...
停用词 问答列表
作者:ShoutOutAndCalculate 提问时间:10/29/2023
NLTK 可用于删除非索引字。从字符串中删除常用词(及其复数版本)的技术 但是,是否有包含“近”、“科学”等“常用词”的库,从而选择“吸引子”等“不常用词”?...
作者:Vincent 提问时间:11/3/2023
Github 中有几个英文停用词存储库。但是,是否有任何停止 2 克或停止 3 克或停止 4 克?我想从从庞大的语料库生成的 ngram 列表中删除 stop-ngrams。 我没有搜索到任何现有数...
作者:Hasitha Gorrepati 提问时间:11/8/2023
导入 NLTK nltk.download('非索引字') 从 nltk.corpus 导入非索引字 stop_words = set(stopwords.words(“英语”)) 我在 kagg...
作者:Vaibhavy Raghuvanshi 提问时间:11/14/2023
这个问题在这里已经有答案了: 从 python shell 下载数据时出现错误 (urlopen) (nltk) (2 个答案) 6天前关闭。 我输入这个来下载停用词 然后我收到这个错误 请帮帮我...