gensim 问答列表

gensim Doc2Vec 模型的评估

作者:swygerts 提问时间:1/6/2023

我开发了一个管道来从文档中提取文本,对文本进行预处理,并在给定文档上训练gensim Doc2vec模型。鉴于我的语料库中有一份文档,我想推荐语料库中的其他文档。 我想知道如何在没有预定义的“好”建...

将 ppmi 矩阵传递给 LsiModel 时除以 0 错误

作者:la_lo_ca 提问时间:8/7/2023

我使用 gensim 的 pmi_scorer 和一个巨大的语料库构建了一个 ppmi 矩阵。每一行都作为单个文档读入和处理。为了避免内存过载,我使用 dtype=int16 创建所有矩阵。 我使用...

LDA 主题建模生成相同/空主题

作者:Dez Miller 提问时间:10/15/2023

我正在对两个大型文本文档(大约 500-750 KB)进行主题建模,并要求十个主题。我一直在重复两个话题。这可能是文件数量少的问题吗?或者我应该更改 alpha/beta 参数? 以下是模型部分的代...

导入 GenSim 和 depreciated warning

作者:Mansour Shams 提问时间:10/30/2023

我正在导入gensim,并在pip安装后出现以下错误: 219:CryptographyDeprecationWarning:Blowfish 已被弃用 “class”: algorithms。河豚...


共4条 当前第1页