我在R中使用无效记录器进行记录。 我有一个在R中使用降雪实现的并行算法。并行过程的每个核心都在记录器中记录一个中间输出。但这个输出没有出现在记录器中?
我们可以使用降雪计划从并行作业中使用无效记录器进行记录吗?
我的具体情况有点不同。我使用我创建的共享对象从R调用C函数。该函数是一个迭代算法,我需要每隔几次迭代记录输出。我有兴趣从C函数记录到无效记录器。为什么徒劳的记录器?因为这是Web应用程序的一部分,所以用户会话的所有输出都以一致的格式出现是有意义的。
这是我根据接受的答案所遵循的一般方法。
# init script
# iter logger namespace global variable
assign("MCMC_LOGGER_NAMESPACE", "iter.logger", envir = .GlobalEnv)
loginit <- function(logfile) {
require('futile.logger')
flog.layout(layout.simple, name = ITER_LOGGER_NAMESPACE)
flog.threshold(TRACE, name = ITER_LOGGER_NAMESPACE)
flog.appender(appender.file(logfile), name = ITER_LOGGER_NAMESPACE)
NULL
}
parallel_funct_call_in_R <- function(required args) {
require('snowfall')
sfSetMaxCPUs()
sfInit(parallel = TRUE, cpus = NUM_CPU)
sfLibrary(required libs)
sfExport(required vars including logger namespace variable ITER_LOGGER_NAMESPACE)
iterLoggers = sprintf(file.path(myloggingdir, 'iterativeLogger_%02d.log', fsep = .Platform$file.sep), seq_len(NUM_CPU))
sfClusterApply(iterLoggers, loginit)
sfSource(required files)
estimates <- sfLapply(list_to_apply_over, func_callling_C_from_R, required args)
sfStop()
return(estimates)
}
iterTrackNumFromC <- function(numvec){
# convert numvec to json and log using flog.info
# the logger namespace has already been registered in the individual cores
flog.info("%s", toJSON(numvec), name = ITER_LOGGER_NAMESPACE)
}
func_callling_C_from_R <- function(args){
load shared obh using dyn.load
estimates = .C("C_func", args, list(iterTrackNumFromC)) # can use .Call also I guess
return(estimates)
}
现在是C函数
void C_func(other args, char **R_loggerfunc){ // R_loggerfunc is passed iterTrackNumFromC
// do stuff
// call function that logs numeric values to futile.logger
logNumericVecInR();
}
void logNumericVecInR (char *Rfunc_logger, double *NumVec, int len_NumVec){
long nargs = 1;
void *arguments[1];
arguments[0] = (double*)NumVec;
char *modes[1];
modes[0] = "double";
long lengths[1];
lengths[0] = len_NumVec;
char *results[1];
// void call_R(char *func, long nargs, void **arguments, char **modes, long *lengths, char **names, long nres, char **results)
call_R(Rfunc_logger, nargs, arguments, modes, lengths, (char**)0, (long)1, results);
}
希望这会有所帮助。如果R和C有一种更简单的方式来共享一个共同的记录器,请告诉我。
答案 0 :(得分:5)
使用降雪程序中的futile.logger包的一种简单方法是使用sfInit
slaveOutfile=''
选项,以便不重定向工作程序输出。
library(snowfall)
sfInit(parallel=TRUE, cpus=3, slaveOutfile='')
sfLibrary(futile.logger)
work <- function(i) {
flog.info('Got task %d', i)
i
}
sfLapply(1:10, work)
sfStop()
这是雪makeCluster
outfile=''
选项的降雪界面。它可能无法正常使用诸如Rgui之类的GUI界面,具体取决于它们如何处理进程输出,但它在使用Rterm.exe的Windows上可以正常工作。
我认为最好为每个工作人员指定不同的日志文件。这是一个例子:
library(snowfall)
nworkers <- 3
sfInit(parallel=TRUE, cpus=nworkers)
loginit <- function(logfile) {
library(futile.logger)
flog.appender(appender.file(logfile))
NULL
}
sfClusterApply(sprintf('out_%02d.log', seq_len(nworkers)), loginit)
work <- function(i) {
flog.info('Got task %d', i)
i
}
sfLapply(1:10, work)
sfStop()
这样可以避免所有来自雪的额外输出,并将每个工作人员的日志消息放入一个单独的文件中,这样可以减少混淆。