将tab和引号作为分隔符导入到R中的csv文件

时间:2013-07-19 14:55:56

标签: r csv

我在csv中有一个带分隔符的数据集,如下所示。

NO_CAND";"DS_CARGO";"CD_CARGO";"NR_CAND";"SG_UE";"NR_CNPJ";"NR_CNPJ_1";
CLODOALDO JOSÉ DE RAMOS";"Deputado Estadual";"7";"22111";"PB";"08126218000107";"Encargos financeiros e taxas bancárias";

我正在使用read.csv2函数和选项

mydataframe <- read.csv2("filename.csv",header = T, sep=";", quote="\\'", dec=",",
stringsAsFactors=F,  check.names = F, fileEncoding="latin1")      

代码读取数据,但包含所有引号。

我尝试使用

删除引号
mydataframe[,] <- apply(mydataframe[,], c(1,2), function(x) { 
gsub("\\'", "", x)
})

但它不起作用。

关于如何导入数据以摆脱这些引用的任何想法?

非常感谢。

1 个答案:

答案 0 :(得分:1)

要删除引号,请按以下步骤使用lapplygsub

mydataframe[] <- lapply(mydataframe, function(x) gsub("\"", "", x))

lapply遍历数据框的所有列并返回一个列表;通过在赋值的LHS上使用mydataframe[],可以将结果分配回数据框而不会丢失其属性(维度,名称等)。此外,您的数据中没有任何单引号',因此搜索它们将无法实现任何目标。