在r中读取带有西班牙字符的csv文件(',ñ)

时间:2015-07-17 20:12:36

标签: r encoding utf-8

我正在尝试向R中的数据框添加一列。为此,我从Excel导入了一个CSV文件,其中包含id列(与数据框中的相同),以及包含我要添加到数据框的信息的列。

我的问题是我的cvs有西班牙语字符(',ñ),当我使用read.csv时(如下例所示)

religion <- read.csv("religion.csv", header = TRUE, sep = ",", dec = ".",
                     filled =TRUE, comment.char = "", strip.white = TRUE,
                     stringsAsFactors = TRUE)

字符不会出现,但会出现问号而不是字符。

我尝试使用以下编码更改编码:

UTF-8,latin1,

Sys.setlocale("LC_ALL", "ES_ES.UTF-8")

但没有区别。

我很高兴感谢任何帮助。

2 个答案:

答案 0 :(得分:4)

使用encoding代码

中的read.csv选项
    religion <- read.csv("religion.csv", header = TRUE, sep = ",", dec = ".",
                         filled =TRUE, comment.char = "", strip.white = TRUE,
                         stringsAsFactors = TRUE, encoding="UTF-8")

请记住,您始终可以使用help(function)

检查R中的文档

答案 1 :(得分:1)

你可以扩展这样的东西:

DF<- data.frame(col1=c(1,2), col2=c("there is an ñ here", "there is an ´ here"))
#   col1    col2
#    1      there is an ñ here
#    2      there is an ´ here

DF$col2 <- chartr("ñ", "n", DF$col2)
DF$col2 <- chartr("´", "'", DF$col2)
DF
#  col1     col2
#   1       there is an n here
#   2       there is an ' here