readLines()在Windows上不能用于特殊字符

时间:2017-09-16 06:00:19

标签: r

我试图使用readLines()从文件中grep一些字符串。在尝试使用RStudio后,我发现它在Mac上工作,但在Windows上失败。

以下是两行文本文件的结果。

的Mac:

> readLines('test.txt', encoding = 'UTF-8', skipNul = T)
[1] "       Nrrrr\316\001\032e\363\f\fY            01     Apple"                    
[2] "                                              02     Orange"

视窗:

> readLines('test.txt', encoding='UTF-8', skipNul = T)
[1] "       Nrrrr蝄001"
Warning message:
In readLines("test.txt", encoding = "UTF-8", skipNul = T) :
  incomplete final line found on 'test.txt'

由于这些文本文件是由其他公司提供的,因此与文件格式进行通信可能需要一些时间。

我想知道是否有办法解决Windows上的问题?

---编辑---

使用readr::read_lines可以避免在包含特殊字符的行停止,但似乎无法获取该行的其余字符:

> readr::read_lines('test.txt')
[1] "       Nrrrr\xce"                                             
[2] "                                                02     orange"

0 个答案:

没有答案