vapply和ddply的多核版本?

时间:2013-11-19 17:55:53

标签: r parallel-processing multicore plyr

我有这样的代码:

plot_cardinality <-function(data,name) {
    scT<-as(eclat(as(data.matrix(data)-1,"transactions"), parameter=list(support=0,minlen=1)),'data.frame')
    # count commas per data row in column items
    scT<-within(scT, size <- vapply(items, count.commas, 1))
    # use ddply to calculate min,mean,max support per size value
    u<-ddply(scT, .(size), summarise, m=mean(support), min=min(support),max=max(support))
    p <- ggplot(u) + geom_errorbar(data=u, aes(x=size, ymin=min, ymax=max))  + geom_point(aes(x=size,y=m), colour="red") +ggtitle(paste("Support for label occurence subsets\ndataset:",name))+xlab("Label subset cardinality")+ylab("Support of label subsets")
return(p)
}

其中count.commas是一个简单的逗号计数功能。这需要很长时间。如何使此代码使用多个内核进行计算?在16核服务器上执行此操作的最佳方法是什么?我应该使用哪种多核解决方案?

0 个答案:

没有答案