由于我没有找到用于分析电生理数据的R包,我使用了一个来自我的小组的尖峰修剪功能:
prune.spikes <- function(spikes, min.isi) {
# copy spike matrix
prunedspikes <- spikes
# initialise index of last spike: infinitely before the first one.
for (i in 1:ncol(spikes)) {
last <- -Inf
for (j in 1:nrow(spikes)) {
if (spikes[j, i] == 1) {
if (j - last < min.isi) {
prunedspikes[j, i] <- 0; # remove the spike
}
else {
last <- j
}
}
}
}
return(prunedspikes)
}
该函数采用由0和1值组成的尖峰矢量或矩阵,如果在最小间隔内发生,则删除任何1。 由于两个嵌套循环,运行需要很长时间。为了优化它,我提出了这个解决方案(删除一个循环):
prune.cols <- function(spikes, min.isi) {
prunedspikes <- apply(spikes, 2, FUN = prune.rows, min.isi = min.isi)
return(prunedspikes)
}
prune.rows <- function(spikes, min.isi) {
prunedspikes <- spikes
last <- -Inf
for (i in 1:length(spikes)) {
if (spikes[i] == 1) {
if (i - last < min.isi) {
prunedspikes[i] <- 0; # remove the spike
}
else {
last <- i
}
}
}
return(prunedspikes)
}
与原始版本相比,在大型数据集上调用prune.cols
的速度要快得多(~60次)。但是仍有一个循环。到目前为止,我无法想出一个简单明了的解决方案。如何进一步改进功能?
答案 0 :(得分:1)
就像@Khashaa提出的那样,我在Rcpp的帮助下实现了这个功能:
NumericMatrix prunespikes(NumericMatrix spikes, double minisi) {
NumericMatrix prunedspikes = spikes;
int ncol = spikes.ncol();
int nrow = spikes.nrow();
for (int i = 0; i < ncol; i++) {
int last = 0;
while (spikes(last, i) == 0) {
last++;
}
for (int j = last + 1; j < nrow; j++) {
if (spikes(j, i) == 1) {
if (j - last < minisi) {
prunedspikes(j, i) = 0;
} else {
last = j;
}
}
}
}
return prunedspikes;
}
答案 1 :(得分:0)
如果速度差异还不是问题,那么保持循环而不是使用Rcpp可能更好。
根据Hadley Wickham的文章Loops that should be left as is,这个循环并不是一个坏主意,因为它可以归类为递归关系案例。
一旦速度成为瓶颈,那么诉诸Rcpp或this page(文章也建议)可能就是解决方案。