在 R PDF 提取中强制输出 utf-8

Force utf-8 output in R PDF extraction

提问人:Steve 提问时间:1/19/2023 更新时间:1/19/2023 访问量:44

问:

我继承了一些 R 代码来从 PDF 文档中提取文本。为简洁起见,对下面的代码片段进行了编辑。我是 R 开发的新手,很难找到我正在使用的函数的详细文档。

library(pdftools)
in_path = commandArgs(trailingOnly=TRUE)
out_path <- file.path(out_directory, out_filename)
write(pdf_text(in_path), out_path)

目标系统是 RedHat Linux 6。这个系统没有连接到互联网,我无法轻松安装任何其他软件包。

如何在输出文件中强制使用 utf-8 编码?

r UTF-8 PDF 工具

评论


答: 暂无答案