R:优化尖峰修剪功能

时间:2015-07-15 12:08:33

标签: r vectorization

由于我没有找到用于分析电生理数据的R包,我使用了一个来自我的小组的尖峰修剪功能:

prune.spikes <- function(spikes, min.isi) {
    # copy spike matrix
    prunedspikes <- spikes

    # initialise index of last spike: infinitely before the first one.
    for (i in 1:ncol(spikes)) {
        last <- -Inf
        for (j in 1:nrow(spikes)) {
            if (spikes[j, i] == 1) {
                if (j - last < min.isi) {
                    prunedspikes[j, i] <- 0;  # remove the spike
                }
                else {
                    last <- j
                }
            }
        }   
    }
    return(prunedspikes)
}

该函数采用由0和1值组成的尖峰矢量或矩阵,如果在最小间隔内发生,则删除任何1。 由于两个嵌套循环,运行需要很长时间。为了优化它,我提出了这个解决方案(删除一个循环):

prune.cols <- function(spikes, min.isi) {
    prunedspikes <- apply(spikes, 2, FUN = prune.rows, min.isi = min.isi)
    return(prunedspikes)
}

prune.rows <- function(spikes, min.isi) {
    prunedspikes <- spikes
    last <- -Inf
    for (i in 1:length(spikes)) {
        if (spikes[i] == 1) {
            if (i - last < min.isi) {
                prunedspikes[i] <- 0;  # remove the spike
            }
            else {
                last <- i
            }
        }
    }
    return(prunedspikes)
}

与原始版本相比,在大型数据集上调用prune.cols的速度要快得多(~60次)。但是仍有一个循环。到目前为止,我无法想出一个简单明了的解决方案。如何进一步改进功能?

2 个答案:

答案 0 :(得分:1)

就像@Khashaa提出的那样,我在Rcpp的帮助下实现了这个功能:

NumericMatrix prunespikes(NumericMatrix spikes, double minisi) {
  NumericMatrix prunedspikes = spikes;
  int ncol = spikes.ncol();
  int nrow = spikes.nrow();
  for (int i = 0; i < ncol; i++) {
    int last = 0;
    while (spikes(last, i) == 0) {
      last++;
    }
    for (int j = last + 1; j < nrow; j++) {
      if (spikes(j, i) == 1) {
        if (j - last < minisi) {
          prunedspikes(j, i) = 0;
        } else {
          last = j;
        }
      }
    }
  }
  return prunedspikes;
}

答案 1 :(得分:0)

如果速度差异还不是问题,那么保持循环而不是使用Rcpp可能更好。

根据Hadley Wickham的文章Loops that should be left as is,这个循环并不是一个坏主意,因为它可以归类为递归关系案例。

一旦速度成为瓶颈,那么诉诸Rcpp或this page(文章也建议)可能就是解决方案。