问题:
对于如何为数据框列表中的列批处理as.numeric()(或任何其他函数),我感到有点困惑。
据我所知,我可以使用以下方法查看此列表中的特定数据框或列:
> my.list[[1]]
# or columns within this data frame using:
> my.list[[1]][1]
但是当我尝试将其应用到lapply()函数中以将所有数据从整数更改为数字时,我遇到了麻烦。
# Example of what I am trying to do
> my.list[[each data frame in list]][each column in data frame] <-
as.numberic(my.list[[each data frame in list]][each column in data frame])
如果你能以任何方式帮助我,或者知道任何可以帮助我的资源,我将不胜感激。
背景:
我的数据框架结构如下图所示,我有5种栖息地类型和有关单个物种家庭范围扩展到 n 的区域的信息:
# Example data
spp.1.data <- data.frame(Habitat.A = c(100,45,0,9,0), Habitat.B = c(0,0,203,45,89), Habitat.C = c(80,22,8,9,20), Habitat.D = c(8,59,77,83,69), Habitat.E = c(23,15,99,0,10))
我有多个具有上述结构的数据框,我已将其分配给列表对象:
all.spp.data <- list(spp.1.data, spp.2.data, spp.1.data...n)
然后我试图将所有数据框强制为as.numeric(),这样我就可以创建%栖息地使用的数据框,即:
# data, which is now numeric as per Phil's code ;)
data.numeric <- lapply(data, function(x) {
x[] <- lapply(x, as.numeric)
x
})
> head(data.numeric[[1]])
Habitat.A Habitat.B Habitat.C Habitat.D Habitat.E
1 100 0 80 8 23
2 45 0 22 59 15
3 0 203 8 77 99
4 9 45 9 83 0
5 0 89 20 69 10
编辑:我想在所有数据框中对每一行求和
# Add row at the end of each data frame populated by rowSums()
f <- function(i){
data.numeric[[i]]$Sums <- rowSums(data.numeric[[i]])
data.numeric[[i]]
}
data.numeric.SUM <- lapply(seq_along(data.numeric), f)
head(data.numeric.SUM[[1]])
Habitat.A Habitat.B Habitat.C Habitat.D Habitat.E Sums
1 100 0 80 8 23 211
2 45 0 22 59 15 141
3 0 203 8 77 99 387
4 9 45 9 83 0 146
5 0 89 20 69 10 188
编辑:这是我用来将数据框中的值转换为使用的%栖息地的代码
# Used Phil's logic to convert all numbers in percentages
data.numeric.SUM.perc <- lapply(data.numeric.SUM,
function(x) {
x[] <- (x[]/x[,6])*100
x
})
Perc.Habitat.A Perc.Habitat.B Perc.Habitat.C Perc.Habitat.D Perc.Habitat.E
1 47 32 0 6 0
2 0 0 52 31 47
3 38 16 2 6 11
4 4 42 20 57 37
5 11 11 26 0 5
6 100 100 100 100 100
这仍然不是最简洁的方法,但它为我做了诀窍。
感谢Phil,Val和Leo P,帮助解决这个问题。
答案 0 :(得分:2)
如果您真的希望使用lapply
完成所有操作,可以选择以下方式:
lapply(all.spp.data,function(x) do.call(cbind,lapply(1:nrow(x),function(y) as.numeric(x[,y]))))
这使用嵌套的lapply
调用。第一个引用单个data.frames
到x
。第二个引用每个x
到y
的列索引。所以最后我可以通过x[,y]
引用每一列。
由于所有内容都将在单个向量中分割,因此我调用do.call(cbind, ... )
将其恢复为矩阵。如果您愿意,可以在其周围添加data.frame()
以将其恢复为原始类型。
答案 1 :(得分:2)
我会更明确地这样做:
all.spp.data <- lapply(all.spp.data, function(x) {
x[] <- lapply(x, as.numeric)
x
})
作为个人偏好,这清楚地告诉我,我正在循环数据框中的每一列,并循环遍历列表中的每个数据帧。