gensim Doc2Vec 模型的评估
作者:swygerts 提问时间:1/6/2023
我开发了一个管道来从文档中提取文本,对文本进行预处理,并在给定文档上训练gensim Doc2vec模型。鉴于我的语料库中有一份文档,我想推荐语料库中的其他文档。 我想知道如何在没有预定义的“好”建...
gensim 问答列表
作者:swygerts 提问时间:1/6/2023
我开发了一个管道来从文档中提取文本,对文本进行预处理,并在给定文档上训练gensim Doc2vec模型。鉴于我的语料库中有一份文档,我想推荐语料库中的其他文档。 我想知道如何在没有预定义的“好”建...
作者:la_lo_ca 提问时间:8/7/2023
我使用 gensim 的 pmi_scorer 和一个巨大的语料库构建了一个 ppmi 矩阵。每一行都作为单个文档读入和处理。为了避免内存过载,我使用 dtype=int16 创建所有矩阵。 我使用...
作者:Dez Miller 提问时间:10/15/2023
我正在对两个大型文本文档(大约 500-750 KB)进行主题建模,并要求十个主题。我一直在重复两个话题。这可能是文件数量少的问题吗?或者我应该更改 alpha/beta 参数? 以下是模型部分的代...
作者:Mansour Shams 提问时间:10/30/2023
我正在导入gensim,并在pip安装后出现以下错误: 219:CryptographyDeprecationWarning:Blowfish 已被弃用 “class”: algorithms。河豚...