我正在使用xtabs
将包含NA
的一些数据制成表格。为了确保总数完整,我使用addNA
来计算缺少因子水平的那些。
但是,这会导致使用xtable
导出到LaTeX for Sweaving时出现问题,因为现在行和列名称中有NA
个。我有一个解决方案:
rownames(tab)[is.na(rownames(tab))]<-"NA"
colnames(tab)[is.na(colnames(tab))]<-"NA"
但是对于很多桌子来说这可能会很烦人,有没有办法更自动地做到这一点?或者是否有更好的方法来制作表格?
答案 0 :(得分:6)
有趣的问题。我也找不到使用xtable本身来解决这个问题的方法。所以我建议的最好的方法是将你的解决方法变成一个可以轻松调用的小函数。
例如:
# Construct some data
df <- data.frame(
x1 = addNA(sample(c(NA, LETTERS[1:4]), 100, replace = TRUE)),
x2 = addNA(sample(c(NA, letters[24:26]), 100, replace = TRUE))
)
# Create a function to rename NA row and column names in a data.frame
rename_NA <- function(x){
rownames(x)[is.na(rownames(x))] <- "NA"
colnames(x)[is.na(colnames(x))] <- "NA"
x
}
tab <- rename_NA(xtabs(~x1+x2, data=df))
xtable(tab)
这会创建有效的乳胶而不会出错:
% latex table generated in R 2.13.0 by xtable 1.5-6 package
% Wed Apr 27 17:20:21 2011
\begin{table}[ht]
\begin{center}
\begin{tabular}{rrrrr}
\hline
& x & y & z & NA \\
\hline
A & 4.00 & 7.00 & 10.00 & 4.00 \\
B & 6.00 & 5.00 & 4.00 & 2.00 \\
C & 8.00 & 4.00 & 4.00 & 2.00 \\
D & 8.00 & 5.00 & 1.00 & 6.00 \\
NA & 5.00 & 2.00 & 7.00 & 6.00 \\
\hline
\end{tabular}
\end{center}
\end{table}
答案 1 :(得分:2)
要考虑的另一个解决方案是使用修改后的addNA
来允许它首先将因子级别输出为字符串:
addNA2 <- function (x, ifany = FALSE, as.string = TRUE)
{
if (!is.factor(x))
x <- factor(x)
if (ifany & !any(is.na(x)))
return(x)
ll <- levels(x)
if (!any(is.na(ll)))
ll <- c(ll, NA)
x <- factor(x, levels = ll, exclude = NULL)
if(as.string) levels(x)[is.na(levels(x))] <- "NA"
x
}