将中文字符从Excel导出到R

时间:2018-06-24 21:24:11

标签: r csv character-encoding

我在Excel中有一个文件,该文件的一栏包含中文简体字。当我从相应的CSV文件在R中打开它时,只会得到?。

恐怕问题出在从Excel导出到CSV时,因为在文本编辑器中打开CSV文件时,我也会得到?。

我该如何解决?

1 个答案:

答案 0 :(得分:4)

保护中文/ Unicode字符的最佳方法是从.xlsx中读取文件:

library(readxl)
read_xlsx("yourfilepath.xlsx", col_types = "text")

如果文件太大而无法从.xlsx读取,则最好的方法是打开Excel并手动拆分为多个文件。 (我使用8GB RAM的笔记本电脑的经验是将文件分成250,000行x 106列。)

如果您需要阅读.csv,则所有Windows设置/本地化都必须与文件相同,但是即使那样也不能保证所有Unicode字符(例如,表情符号)的完整性。 / p>

(如果您还需要.csv进行其他操作,则在将数据从R读入write.csv后,可以使用.xlsx函数R。 )