R lapply():将列表中所有数据框中的所有列更改为数字,然后将所有值转换为百分比

时间:2017-06-14 10:55:59

标签: r lapply

问题:

对于如何为数据框列表中的列批处理as.numeric()(或任何其他函数),我感到有点困惑。

据我所知,我可以使用以下方法查看此列表中的特定数据框或列:

> my.list[[1]] 
# or columns within this data frame using:
> my.list[[1]][1]

但是当我尝试将其应用到lapply()函数中以将所有数据从整数更改为数字时,我遇到了麻烦。

# Example of what I am trying to do
> my.list[[each data frame in list]][each column in data frame] <- 
as.numberic(my.list[[each data frame in list]][each column in data frame])

如果你能以任何方式帮助我,或者知道任何可以帮助我的资源,我将不胜感激。

背景:

我的数据框架结构如下图所示,我有5种栖息地类型和有关单个物种家庭范围扩展到 n 的区域的信息:

# Example data
spp.1.data <- data.frame(Habitat.A = c(100,45,0,9,0), Habitat.B =  c(0,0,203,45,89), Habitat.C = c(80,22,8,9,20), Habitat.D = c(8,59,77,83,69), Habitat.E = c(23,15,99,0,10))

我有多个具有上述结构的数据框,我已将其分配给列表对象:

all.spp.data <- list(spp.1.data, spp.2.data, spp.1.data...n)

然后我试图将所有数据框强制为as.numeric(),这样我就可以创建%栖息地使用的数据框,即:

# data, which is now numeric as per Phil's code ;)

 data.numeric <- lapply(data, function(x) {
  x[] <- lapply(x, as.numeric)
  x
   })

> head(data.numeric[[1]])
  Habitat.A Habitat.B Habitat.C Habitat.D Habitat.E
1       100         0        80         8        23
2        45         0        22        59        15
3         0       203         8        77        99
4         9        45         9        83         0
5         0        89        20        69        10

编辑:我想在所有数据框中对每一行求和

# Add row at the end of each data frame populated by rowSums()

 f <- function(i){
      data.numeric[[i]]$Sums <- rowSums(data.numeric[[i]])
      data.numeric[[i]]
  }

data.numeric.SUM <- lapply(seq_along(data.numeric), f)
head(data.numeric.SUM[[1]])

 Habitat.A Habitat.B Habitat.C Habitat.D Habitat.E     Sums
1       100         0        80         8        23   211
2        45         0        22        59        15   141
3         0       203         8        77        99   387
4         9        45         9        83         0   146
5         0        89        20        69        10   188

编辑:这是我用来将数据框中的值转换为使用的%栖息地的代码

# Used Phil's logic to convert all numbers in percentages

data.numeric.SUM.perc <- lapply(data.numeric.SUM, 
function(x) {
x[] <- (x[]/x[,6])*100
x
})

 Perc.Habitat.A Perc.Habitat.B Perc.Habitat.C Perc.Habitat.D Perc.Habitat.E
1             47             32              0              6              0
2              0              0             52             31             47
3             38             16              2              6             11
4              4             42             20             57             37
5             11             11             26              0              5
6            100            100            100            100            100

这仍然不是最简洁的方法,但它为我做了诀窍。

感谢Phil,Val和Leo P,帮助解决这个问题。

2 个答案:

答案 0 :(得分:2)

如果您真的希望使用lapply完成所有操作,可以选择以下方式:

lapply(all.spp.data,function(x) do.call(cbind,lapply(1:nrow(x),function(y) as.numeric(x[,y]))))

这使用嵌套的lapply调用。第一个引用单个data.framesx。第二个引用每个xy的列索引。所以最后我可以通过x[,y]引用每一列。

由于所有内容都将在单个向量中分割,因此我调用do.call(cbind, ... )将其恢复为矩阵。如果您愿意,可以在其周围添加data.frame()以将其恢复为原始类型。

答案 1 :(得分:2)

我会更明确地这样做:

all.spp.data <- lapply(all.spp.data, function(x) {
  x[] <- lapply(x, as.numeric)
  x
})

作为个人偏好,这清楚地告诉我,我正在循环数据框中的每一列,并循环遍历列表中的每个数据帧。