我在Excel中有一个文件,该文件的一栏包含中文简体字。当我从相应的CSV文件在R中打开它时,只会得到?。
恐怕问题出在从Excel导出到CSV时,因为在文本编辑器中打开CSV文件时,我也会得到?。
我该如何解决?
答案 0 :(得分:4)
保护中文/ Unicode字符的最佳方法是从.xlsx
中读取文件:
library(readxl)
read_xlsx("yourfilepath.xlsx", col_types = "text")
如果文件太大而无法从.xlsx
读取,则最好的方法是打开Excel并手动拆分为多个文件。
(我使用8GB RAM的笔记本电脑的经验是将文件分成250,000行x 106列。)
如果您需要阅读.csv
,则所有Windows设置/本地化都必须与文件相同,但是即使那样也不能保证所有Unicode字符(例如,表情符号)的完整性。 / p>
(如果您还需要.csv
进行其他操作,则在将数据从R
读入write.csv
后,可以使用.xlsx
函数R
。 )