for循环R中的ifelse语句

时间:2018-06-01 05:55:53

标签: r loops if-statement

我目前正在处理一个非常大的高程数据集,我需要根据10米间隔的分级高程来确定每行的特定温度。因为数据集太大,我不能写一个简单的循环。我创建了一个较小的假数据集来演示我想要完成的任务。

elevation <- seq(0, 100, 10)

e <- runif(n=100,min=0,max=100)
lettertype <- c(rep("a", 25), rep("b", 25), rep("c", 50))
x <- data.frame(e, lettertype)

Winter <- runif(n=10, min=10, max=15)
Spring <- runif(n=10, min=12, max=16)
Summer <- runif(n=10, min=14, max=20)
Fall   <- runif(n=10, min=11, max=16)
elevbin <- c("0 to 10", "10 to 20", "20 to 30", "30 to 40", "40 to 50", 
              "50 to 60", "60 to 70", "70 to 80", "80 to 90", "90 to 100")
y <- data.frame(elevbin, Winter, Spring, Summer, Fall)

Wintertemp <- c()
for (i in 1:length(y$Winter)){
  for (j in 1:length(elevation)){
    for (k in 1:length(x$e)){
      Wintertemp <- c(Wintertemp, (ifelse(x$e[k] >= elevation[j] & x$e < elevation[j+1],  y$Winter[i], NA)))
    }
  }
}

基本上,高程是一个向量,它将告诉for循环每个区域内的高程(同样,由于数据集的大小,跨越200个高程区,这必须是自动化的)。

  • 数据框x是我拥有的原始高程数据的示例,列&#34; lettertype&#34;并不重要,它只是将矢量e转换为数据帧的附加组件。

  • 数据框y有关于哪个温度(按季节,在本例中我只使用冬季但我需要在每个季节执行此操作)的信息在每个高程箱中表示。

  • 我想将输出cbind到dataframe x

例如:

head(x)
          e lettertype
1  5.801268          a
2 99.115869          a
3 31.928297          a
4 25.886745          a
5 93.288743          a
6 23.496359          a

y
     elevbin   Winter
1    0 to 10 12.51486
2   10 to 20 14.14977
3   20 to 30 10.19768
4   30 to 40 12.63925
5   40 to 50 10.18445
6   50 to 60 10.91821
7   60 to 70 13.00326
8   70 to 80 11.89128
9   80 to 90 13.88241
10 90 to 100 12.33358

所以我希望我的结果是:

head(x)
          e lettertype   Winter
1  5.801268          a 12.51486
2 99.115869          a 12.33358
3 31.928297          a 12.63925
4 25.886745          a 10.19768
5 93.288743          a 12.33358
6 23.496359          a 10.19768

简单来说,我想根据高程分档的温度为数据帧x中的每个高程(e)分配正确的温度。

目前,代码返回一个长度为1100000的向量,其中包含NA和冬季向量中的第一个数字,这是不正确的。结果应与x数据帧的长度相同。

任何帮助都会很棒!提前致谢!

1 个答案:

答案 0 :(得分:0)

不需要for循环或ifelse。如果您先创建适当的列,则可以merge这两个数据框:

elevation <- seq(0, 100, 10)

e <- c(seq(0, 99, 1))
elev_floor <- 10 * floor(e / 10)
x <- data.frame(e, elev_floor)

Winter <- runif(n=10, min=10, max=15)
Spring <- runif(n=10, min=12, max=16)
Summer <- runif(n=10, min=14, max=20)
Fall   <- runif(n=10, min=11, max=16)
elevbin <- c("0 to 10", "10 to 20", "20 to 30", "30 to 40", "40 to 50", 
             "50 to 60", "60 to 70", "70 to 80", "80 to 90", "90 to 100")
elev_floor <- seq(0, 90, 10)
y <- data.frame(elevbin, elevmin, Winter, Spring, Summer, Fall)

merge(x, y)

结果:

      e elev_floor   elevbin elevmin   Winter   Spring   Summer     Fall
1     0          0   0 to 10       0 12.53781 13.01907 16.74989 15.22208
2     1          0   0 to 10       0 12.53781 13.01907 16.74989 15.22208
3     2          0   0 to 10       0 12.53781 13.01907 16.74989 15.22208
4     3          0   0 to 10       0 12.53781 13.01907 16.74989 15.22208
5     4          0   0 to 10       0 12.53781 13.01907 16.74989 15.22208
6     5          0   0 to 10       0 12.53781 13.01907 16.74989 15.22208
7     6          0   0 to 10       0 12.53781 13.01907 16.74989 15.22208
8     7          0   0 to 10       0 12.53781 13.01907 16.74989 15.22208
9     8          0   0 to 10       0 12.53781 13.01907 16.74989 15.22208
10    9          0   0 to 10       0 12.53781 13.01907 16.74989 15.22208
11   10         10   0 to 10       0 12.53781 13.01907 16.74989 15.22208
12   11         10   0 to 10       0 12.53781 13.01907 16.74989 15.22208
13   12         10   0 to 10       0 12.53781 13.01907 16.74989 15.22208
14   13         10   0 to 10       0 12.53781 13.01907 16.74989 15.22208

如果你的垃圾箱比你的例子更复杂,那么你可以调整x$elev_floor的计算。