提问人:lwe 提问时间:12/9/2022 更新时间:12/9/2022 访问量:17
数据帧元数据未在 R 中使用 TextResuseCorpus 命令附加
Dataframe meta-data not attaching with TextResuseCorpus command in R
问:
我有一个包含两列的数据帧(),如下所示:twitterdata1
full_name | 发短信 |
---|---|
John | 我爱我的妻子、孩子和台球俱乐部 |
拉里 | 中西部最好的该死的兽医 |
汤姆 | 社会工作和药物滥用教授。俄亥俄州立大学。 |
提姆 | 退休的卡车司机,有家室的男人。 |
抢 | 语言学教授。俄亥俄州立大学。 |
山 姆 | 宾夕法尼亚州立大学生物行为健康博士生 |
我正在尝试使用下面的TextResuseCorpus命令将上面的数据帧转换为标记化的语料库:
corpus <- TextReuseCorpus(text = twitterdata1, meta = list("full_name" = "full_name"), tokenizer = tokenize_ngrams, n = 2)
代码运行时没有任何错误。但是当我尝试查找附加的元数据()时,它没有显示出来。我只是得到下面的输出。如何将 作为元数据附加到数据帧中,这样我就不会丢失该数据?如果它能作为文件的名称附加,我什至会很高兴。full_names
full_names
任何帮助将不胜感激。
> meta(corpus[[224]])
$hash_func
[1] "hash_string"
$id
[1] "doc-228"
$minhash_func
NULL
$tokenizer
[1] "tokenize_ngrams"
答: 暂无答案
评论