拆分数据框以传递给R中的sprintf

时间:2015-01-21 02:15:03

标签: r dataframe printf lapply

我有一个sprintf格式字符串,我正在尝试解析R中的数据帧。我构建了这个代码来做到这一点,但如果不是丑陋的话,那就没什么了。有什么更好的方法呢?

writeData<-function(DataSet,FirstLine,FmtString,fName){
    correctLine<-function (MyLine,FmtString){
        do.call(sprintf,c(FmtString,MyLine))
    }
    #why the ugly split code? Because otherwise it casts my nice data frame as characters which confuses sprintf.
    outLines=lapply(split(DataSet,1:NROW(DataSet)),function (x){correctLine(x,FmtString)})
    writeLines(unlist(outLines),fName)
    return(0)
}

以下是一个例子:

z=data.frame(d1=c("A","B","C"),d2=c(1,2,3),d3=c("D","E","F"),stringsAsFactors=FALSE)
fmt="%s %0.3f %s"
writeData(z,"",fmt,"~/sample.txt")

对比:

correctLine<-function (MyLine,FmtString){do.call(sprintf,c(FmtString,MyLine))}
apply(z,1,function(x) {correctLine(x,fmt)}) #Errors out, wants a list
correctLine<-function (MyLine,FmtString){do.call(sprintf,as.list(c(FmtString,MyLine)))}
apply(z,1,function(x) {correctLine(x,fmt)}) # - still unhappy, now we have a character array. This is the problem.

1 个答案:

答案 0 :(得分:4)

如果我了解您要正确执行的操作,那么您只需要使用所有列调用sprintf一次即可进行格式化。例如

writeData <- function(DataSet,FirstLine, FmtString,fName){
    outlines <- do.call("sprintf", c(FmtString, DataSet))
    writeLines(outLines,fName)
    return(0)
}

R中的大多数函数都是为了处理数据向量,所以一次只传入整个列,而不是遍历行。