数据帧元数据未在 R 中使用 TextResuseCorpus 命令附加

Dataframe meta-data not attaching with TextResuseCorpus command in R

提问人:lwe 提问时间:12/9/2022 更新时间:12/9/2022 访问量:17

问:

我有一个包含两列的数据帧(),如下所示:twitterdata1

full_name 发短信
John 我爱我的妻子、孩子和台球俱乐部
拉里 中西部最好的该死的兽医
汤姆 社会工作和药物滥用教授。俄亥俄州立大学。
提姆 退休的卡车司机,有家室的男人。
语言学教授。俄亥俄州立大学。
山 姆 宾夕法尼亚州立大学生物行为健康博士生

我正在尝试使用下面的TextResuseCorpus命令将上面的数据帧转换为标记化的语料库:

corpus <- TextReuseCorpus(text = twitterdata1, meta = list("full_name" = "full_name"), tokenizer = tokenize_ngrams, n = 2)

代码运行时没有任何错误。但是当我尝试查找附加的元数据()时,它没有显示出来。我只是得到下面的输出。如何将 作为元数据附加到数据帧中,这样我就不会丢失该数据?如果它能作为文件的名称附加,我什至会很高兴。full_namesfull_names

任何帮助将不胜感激。

> meta(corpus[[224]])
$hash_func
[1] "hash_string"

$id
[1] "doc-228"

$minhash_func
NULL

$tokenizer
[1] "tokenize_ngrams"
R 数据帧 元数据 TM 语料库

评论


答: 暂无答案