read.csv的编码:数据被截断,特殊字符无法正确读取

时间:2017-06-01 14:28:27

标签: r csv encoding utf-8 import

我想在R Studio中读取一个包含5.000个观测值的csv文件。如果我将编码设置为UTF-8,则只导入3.500个观察值,并收到2条警告消息:

# Example code
options(encoding = "UTF-8")
df <- read.csv("path/data.csv", dec = ".", sep = ",")
  

1:在输入连接上找到无效输入

     

2:引用字符串中的EOF

根据this thread,我能够找到一些能够读取整个csv文件的编码,例如windows-1258。但是,使用此编码时,ä,ü或ß等特殊字符无法正确读取。

我的猜测是,UTF-8是正确的编码,但csv文件的字符/因子变量有问题。出于这个原因,我需要一种方法来使用UTF-8读取整个csv文件。任何帮助都非常感谢!

0 个答案:

没有答案