strsplit通过变量分隔符

时间:2012-07-06 22:10:03

标签: r strsplit

我有一些由“”分隔的数据字符串需要拆分成列。是否有一种简单的方法可以按每个第n个分隔符拆分数据。例如,x中的第一个值告诉您y中的前4个值对应于第一个试验。 x中的第二个值告诉您y中接下来的3个值对应于第二个试验,依此类推。

x <- c("4 3 3", "3 3 3 2 3")
y <- c("110 88 77 66 55 44 33 22 33 44 11 22 11", "44 55 66 33 22 11 22 33 44 55 66 77 88 66 77 88")

目标是这样的:

structure(list(session = 1:2, trial.1 = structure(1:2, .Label = c("110 88 77", 
"44 55 66"), class = "factor"), trial.2 = structure(c(2L, 1L), .Label = c("33 22 11", 
"66 55 44"), class = "factor"), trial.3 = structure(1:2, .Label = c("22 33 44", 
"23 33 44"), class = "factor"), trial.4 = structure(c(NA, 1L), .Label = "55 66", class = "factor"), 
    trial.5 = structure(c(NA, 1L), .Label = "77 88 66", class = "factor")), .Names = c("session", 
"trial.1", "trial.2", "trial.3", "trial.4", "trial.5"), class = "data.frame", row.names = c(NA, 
-2L))

理想情况下,需要从结果数据帧中删除y中的任何额外值,并且应使用NA填充不均匀的行长度。

1 个答案:

答案 0 :(得分:3)

这可能很有用

dumx<-strsplit(x,' ')
dumy<-strsplit(y,' ')
dumx<-lapply(dumx,function(x)(cumsum(as.numeric(x))))
dumx<-lapply(dumx,function(x){mapply(seq,c(1,x+1)[-(length(x)+1)],x,SIMPLIFY=FALSE)})
ans<-mapply(function(x,y){lapply(x,function(w,z){z[w]},z=y)},dumx,dumy)

我将让您将结果列表转换为dataframe:)