数据帧元数据未在 R 中使用 TextResuseCorpus 命令附加
作者:lwe 提问时间:12/9/2022
我有一个包含两列的数据帧(),如下所示:twitterdata1 full_name 发短信 John 我爱我的妻子、孩子和台球俱乐部 拉里 中西部最好的该死的兽医 汤姆 社会工作和药物滥用教授。俄...
语料库 问答列表
作者:lwe 提问时间:12/9/2022
我有一个包含两列的数据帧(),如下所示:twitterdata1 full_name 发短信 John 我爱我的妻子、孩子和台球俱乐部 拉里 中西部最好的该死的兽医 汤姆 社会工作和药物滥用教授。俄...
作者:mnr 提问时间:2/24/2023
以下代码... library(tm) vectorOfText <- c("twas brillig and the slithey toves", "did gyre and gimble...
作者:elbillaf 提问时间:3/30/2023
我在 Window 上使用 R4.2.2,我正在尝试在这里完成文本挖掘示例: https://medium.com/@SAPCAI/text-clustering-with-r-an-introduc...
作者:Rastko M. 提问时间:5/20/2023
将数据框转换为语料库时出现问题 您好,我有一个有 4 列的 df(1 是文本,另外 3 是一些附加信息)。 我想将 df 转换为语料库,以便每行的文本都是一个文档,同一行不同列中的相应信息是元数据。...
作者:Vahid 提问时间:9/1/2023
我有一个包含 500 篇研究文章的语料库,我想提取前 4 克,不仅仅是基于最高频率,而是与一般研究文章类型的相关性(该类型的 4 克特征)。 推荐使用 TF-IDF,使用 Scikit-learn,...
作者:Illimar Rekand 提问时间:10/18/2023
我有以下语料库: library(jsonlite) library(tm) query = "https://www.ebi.ac.uk/ebisearch/ws/rest/pride?quer...