我希望在R中读取我以Unicode格式从GCS下载的CSV文件。
当我尝试阅读文件时,它会像这样:
警告消息:在扫描中(file = file,what = what,sep = sep,quote = quote,dec = dec,:在输入连接上找到无效输入'reviews_report_201605.csv'
数据被读取到第39行,在那里它遇到一个特殊字符,无法再读取:
未登录部分中的2个基本功能无效。 ,2016-05-03T09:52:06Z,1462269126290
代码在到达笑脸时会截断。我也不介意将笑脸作为问号阅读。
我的解决方法是通过记事本将CSV保存为ANSI文件,将相同的笑脸转换为??。
我如何在R中执行此操作?我尝试过多种方法,但没有一种方法可行,而且由于文件很多,因此无法手动操作。
我作为文件应用的代码是Unicode,如下所示:
reviews1 <- read.csv("reviews_report_201605.csv", header = T,stringsAsFactors = F,fileEncoding = "UTF-16LE")
请提出任何有关如何解决此问题的建议。