在使用lapply时强制表具有相等的尺寸

时间:2019-02-27 09:55:48

标签: r histogram data-visualization transition lapply

我正在尝试绘制150个人的频率与状态之间转换的数量。为此,使用lapply以便为每个人生成转换表。但是,由于某些人只有很少的转换或根本没有转换,因此生成的表在行数/列数上彼此不同。因此,当我尝试提取过渡数量以进行绘制时,出现“尺寸错误”错误。我见过this线程,但未成功将解决方案应用于我的案例。

这是我当前的代码:

n_STATEs <- 4

data <- read.csv("transitiondata.csv")
transitions <- by(data,data$ID,
                  function(xx)data.frame(ID=head(xx$ID,-1),
                                         TIME=tail(xx$TIME,-1),
                                         FROM=head(xx$STATE,-1),
                                         TO=tail(xx$STATE,-1)))
transition_table <- lapply(transitions,function(xx)with(xx,table(FROM,TO)))
min_n_transitions <- min(unlist(transition_table))
max_n_transitions <- max(unlist(transition_table))
max_freq <- 150  

par(mfrow=rep(n_STATEs,2),mai=c(.4,.4,.4,.1))
for ( from in 1:n_STATEs ) {
  for ( to in 1:n_STATEs ) {
    sapply(transition_table,"[",from,to)
    hist(foo,freq=TRUE,
         xlim=c(min_n_transitions,max_n_transitions),
         ylim=c(0,max_freq),xlab="",ylab="",
         main=paste("From",from,"to",to),las=1,col="lightgray")
  }
}

Here是数据集。我还尝试了在不使用lapply的情况下获取过渡编号(请参见我的previous线程中的答案),但是这种方法还计算了一个人中最后一个时间点与第一个时间点之间的过渡,这没有任何意义。 / p>

提前谢谢!

编辑:代码固定。


另一种方法是this one。错误消息消失了,但是,也许是由于行和列的排序不同,所以转换计数显然是错误的。当前代码如下:

n_STATEs <- 4

    data <- read.csv("transitiondata.csv")
    transitions <- by(data,data$ID,
                      function(xx)data.frame(ID=head(xx$ID,-1),
                                             TIME=tail(xx$TIME,-1),
                                             FROM=head(xx$STATE,-1),
                                             TO=tail(xx$STATE,-1)))
    transition_table <- lapply(transitions,function(xx)with(xx,table(FROM,TO)))
cols <- unique(unlist(sapply(transition_table, colnames)))
rows <- unique(unlist(sapply(transition_table, rownames)))
result <- lapply(transition_table, function(m) {
  missingrows <- setdiff(rows, rownames(m))
  missingcols <- setdiff(cols, colnames(m))
  rbind(cbind(m,
              structure(matrix(0, nrow=nrow(m), ncol=length(missingcols)),
                        dimnames=list(NULL, missingcols))),
        structure(matrix(0, nrow=length(missingrows), ncol=length(cols)),
                  dimnames=list(missingrows)))
})
min_n_transitions <- min(unlist(result))
    max_n_transitions <- max(unlist(result))
    max_freq <- 150  

    par(mfrow=rep(n_STATEs,2),mai=c(.4,.4,.4,.1))
    for ( from in 1:n_STATEs ) {
      for ( to in 1:n_STATEs ) {
        sapply(result,"[",from,to)
        hist(foo,freq=TRUE,
             xlim=c(min_n_transitions,max_n_transitions),
             ylim=c(0,max_freq),xlab="",ylab="",
             main=paste("From",from,"to",to),las=1,col="lightgray")
      }
    }

还有其他可能性吗?

1 个答案:

答案 0 :(得分:0)

我找到了替代解决方案。使用this代码,我还获得了一个ID的最后一个时间点与第一个时间点之间的转换计数。但是,使用if (i > this.state.insights[0].start && i < this.state.insights[0].end || / i > this.state.insights[1].start && i < this.state.insights[1].end || i > this.state.insights[2].start && i < this.state.insights[2].end ||) arrange可以摆脱这种奇怪的行为。当前代码如下:

subset