语料库 问答列表

数据帧元数据未在 R 中使用 TextResuseCorpus 命令附加

作者:lwe 提问时间:12/9/2022

我有一个包含两列的数据帧(),如下所示:twitterdata1 full_name 发短信 John 我爱我的妻子、孩子和台球俱乐部 拉里 中西部最好的该死的兽医 汤姆 社会工作和药物滥用教授。俄...

使用 R 的 tm 包,VectorSource 生成一个列表而不是语料库

作者:mnr 提问时间:2/24/2023

以下代码... library(tm) vectorOfText <- c("twas brillig and the slithey toves", "did gyre and gimble...

R 文本挖掘示例在 iconv 上失败

作者:elbillaf 提问时间:3/30/2023

我在 Window 上使用 R4.2.2,我正在尝试在这里完成文本挖掘示例: https://medium.com/@SAPCAI/text-clustering-with-r-an-introduc...

在 R 中使用 tm 将包含元数据列的数据帧转换为语料库

作者:Rastko M. 提问时间:5/20/2023

将数据框转换为语料库时出现问题 您好,我有一个有 4 列的 df(1 是文本,另外 3 是一些附加信息)。 我想将 df 转换为语料库,以便每行的文本都是一个文档,同一行不同列中的相应信息是元数据。...

在语料库中提取“代表性”(不一定是最常见的)4 克的推荐方法?TF-IDF 或

作者:Vahid 提问时间:9/1/2023

我有一个包含 500 篇研究文章的语料库,我想提取前 4 克,不仅仅是基于最高频率,而是与一般研究文章类型的相关性(该类型的 4 克特征)。 推荐使用 TF-IDF,使用 Scikit-learn,...

无法编辑语料库中的元数据

作者:Illimar Rekand 提问时间:10/18/2023

我有以下语料库: library(jsonlite) library(tm) query = "https://www.ebi.ac.uk/ebisearch/ws/rest/pride?quer...


共6条 当前第1页