Readlines()编码问题,特殊字符

时间:2019-03-13 08:48:46

标签: r encoding readlines

我的文件中有一些重音,并且我尝试使用正确的编码打开此文件,但是每次我打开此文件时,我的重音都带有特殊字符(),尽管我提到过要打开编码= UTF-8的文件

mes_keywords_to_check <- readLines("mot cle holidays.txt", encoding='UTF-8')

你知道是什么问题吗?

1 个答案:

答案 0 :(得分:0)

我可以重现您的问题:

temp <- tempfile(fileext = ".txt")

write("Ole Gunnar Solskjær", temp)

readLines(temp, encoding = "UTF-8")

[1] "Ole Gunnar Solskj\xe6r"

但是,在我的情况下,可以通过省略readLines中的编码参数(或使用latin1代替UTF-8来解决):

readLines(temp)
[1] "Ole Gunnar Solskjær"

readLines(temp, encoding = "latin1")
[1] "Ole Gunnar Solskjær"