我正在使用R Studio,需要导入用于文本挖掘的csv文件。 文件是windows-1252编码,包含德语元音。
但是我不能让R正确导入这些变形金刚。使用read.table(X,fileEncoding =“UTF-8”)会导致错误。
我错过了什么?
---- ---- UPDATE
我想读的文件是: https://drive.google.com/file/d/0B4kGh2YwTmb9U3hkei1TTHlUME0/edit?usp=sharing
使用此R代码:
Sys.setlocale("LC_CTYPE", "german")
dataset <- read.table("../processed/DE_all_CDM_201405050001_DE_all_CDM2014-05-05_rcout.csv", encoding="UTF-8", header=TRUE, sep=";", stringsAsFactors=F, as.is=T)
dataset <- dataset[,c(1,11,30)]
Encoding(dataset[,2]) <- "UTF-8"
答案 0 :(得分:2)
好的,我刚刚发现这是一个R Studio GUI问题。如果我在R控制台中运行我的代码就可以了。