提问人:Nikos Alexandris 提问时间:8/19/2016 最后编辑:CommunityNikos Alexandris 更新时间:8/19/2016 访问量:5027
带有 R Markdown、knitr 和 Windows 的 UTF-8
UTF-8 with R Markdown, knitr and Windows
问:
什么?
文件通过 Linux 中的(或 )无错误呈现。相关材料(即子 R 脚本和 CSV 输入数据)均以 UTF-8 格式设置。.Rmd
knitr
rmarkdown
从 Windows 中执行相同的脚本(实际上该脚本位于克隆的 git 存储库中)不会干净地呈现所有字符,因为它设置为 Windows-1252。
例子
例如,从 CSV 源到某些 data.frame 的列内容中的字符串排版为 。要正确阅读这个,在读入数据时添加 就足够了。"sans réserves"
"sans réserves"
encoding='UTF-8'
read.csv
另一个涉及其他代码行中的条目的示例是字符串 。排版为 。幸运的是,以下建议R
"Trésorier Général"
"Trésorier Général"
read_chunk(lines = readLines("TestSpanishText.R", encoding = "UTF-8"))
取自 https://stackoverflow.com/a/15714617/1172302,工作正常,字符串按预期呈现。
相关
[更新]有一些相关的问答,但它们已经有 2-3 年的历史了。同样,此页面 https://support.rstudio.com/hc/en-us/articles/200532197-Character-Encoding 指出了这个问题。
问题
有没有另一种更简单的方法来克服这个问题,以及内部的Windows?关于如何处理此类问题的建议?我试图遵循一个单一来源的所有原则。UTF-8
R
ps- 一个有趣的阅读:https://superuser.com/a/221602/128768
答: 暂无答案
评论
read_chunk