R - 将CSV文件从Unicode转换为Windows-1252

时间:2017-05-30 18:38:57

标签: r unicode encoding windows-1252

我希望在R中读取我以Unicode格式从GCS下载的CSV文件。

当我尝试阅读文件时,它会像这样:

  

警告消息:在扫描中(file = file,what = what,sep = sep,quote = quote,dec = dec,:在输入连接上找到无效输入'reviews_report_201605.csv'

数据被读取到第39行,在那里它遇到一个特殊字符,无法再读取:

  

未登录部分中的2个基本功能无效。   ,2016-05-03T09:52:06Z,1462269126290

代码在到达笑脸时会截断。我也不介意将笑脸作为问号阅读。

我的解决方法是通过记事本将CSV保存为ANSI文件,将相同的笑脸转换为??。

我如何在R中执行此操作?我尝试过多种方法,但没有一种方法可行,而且由于文件很多,因此无法手动操作。

我作为文件应用的代码是Unicode,如下所示:

reviews1 <- read.csv("reviews_report_201605.csv", header = T,stringsAsFactors = F,fileEncoding = "UTF-16LE")

请提出任何有关如何解决此问题的建议。

0 个答案:

没有答案