我有一个数据框,其中包含投票和政党标签
dat <- data.frame( v1=c(25, 0, 70),
v2=c(75, 100, 20),
v3=c(0, 0, 10),
l1=c("pA", ".", "pB"),
l2=c("pB", "pC", "pC"),
l3=c(".", ".", "pD") )
这样每行都是一个分析单位。只有投票方才需要考虑,此功能可以提取正面投票或相应的标签
getpos <- function(vector, vorl="v"){ # change to "l" to report labels
vot <- vector[grep( "v", colnames(vector) )];
lab <- vector[grep( "l", colnames(vector) )];
if (vorl=="v") {vot[vot>0]} else {lab[vot>0]};
}
getpos(dat[1,]) # votes for obs 1
getpos(dat[1,], vorl="l") # labels for obs 1
我希望在数据帧dat的每一行中运行函数getpos,以便生成具有不同长度的投票/标签向量的列表。应用该函数不会返回我期望的内容:
apply(X=dat, MARGIN=1, FUN=getpos, vorl="l")
有人能发现问题吗?相关的,这可以更有效地实现吗?
答案 0 :(得分:6)
这里发生的事情是数据框中的行在被apply
提取后不再具有列名称(但它们确实有names
):
尝试:
getpos <- function(x, vorl="v"){
vot <- x[grep( "v", names(x) )] ; lab <- x[grep( "l", names(x) )];
if (vorl=="v") {vot[vot>0]} else {lab[vot>0]};
}
> apply(dat, MARGIN=1, FUN=function(x2) getpos(x2, vorl="l") )
#-------------
[[1]]
l1
"pA"
[[2]]
l2
"pC"
[[3]]
l1 l3
"pB" "pD"