我想在R Studio
中读取一个包含5.000个观测值的csv文件。如果我将编码设置为UTF-8
,则只导入3.500个观察值,并收到2条警告消息:
# Example code
options(encoding = "UTF-8")
df <- read.csv("path/data.csv", dec = ".", sep = ",")
1:在输入连接上找到无效输入
2:引用字符串中的EOF
根据this thread,我能够找到一些能够读取整个csv文件的编码,例如windows-1258
。但是,使用此编码时,ä,ü或ß等特殊字符无法正确读取。
我的猜测是,UTF-8
是正确的编码,但csv文件的字符/因子变量有问题。出于这个原因,我需要一种方法来使用UTF-8
读取整个csv文件。任何帮助都非常感谢!