我目前正在处理一个非常大的高程数据集,我需要根据10米间隔的分级高程来确定每行的特定温度。因为数据集太大,我不能写一个简单的循环。我创建了一个较小的假数据集来演示我想要完成的任务。
elevation <- seq(0, 100, 10)
e <- runif(n=100,min=0,max=100)
lettertype <- c(rep("a", 25), rep("b", 25), rep("c", 50))
x <- data.frame(e, lettertype)
Winter <- runif(n=10, min=10, max=15)
Spring <- runif(n=10, min=12, max=16)
Summer <- runif(n=10, min=14, max=20)
Fall <- runif(n=10, min=11, max=16)
elevbin <- c("0 to 10", "10 to 20", "20 to 30", "30 to 40", "40 to 50",
"50 to 60", "60 to 70", "70 to 80", "80 to 90", "90 to 100")
y <- data.frame(elevbin, Winter, Spring, Summer, Fall)
Wintertemp <- c()
for (i in 1:length(y$Winter)){
for (j in 1:length(elevation)){
for (k in 1:length(x$e)){
Wintertemp <- c(Wintertemp, (ifelse(x$e[k] >= elevation[j] & x$e < elevation[j+1], y$Winter[i], NA)))
}
}
}
基本上,高程是一个向量,它将告诉for循环每个区域内的高程(同样,由于数据集的大小,跨越200个高程区,这必须是自动化的)。
数据框x是我拥有的原始高程数据的示例,列&#34; lettertype&#34;并不重要,它只是将矢量e转换为数据帧的附加组件。
数据框y有关于哪个温度(按季节,在本例中我只使用冬季但我需要在每个季节执行此操作)的信息在每个高程箱中表示。
我想将输出cbind到dataframe x
例如:
head(x)
e lettertype
1 5.801268 a
2 99.115869 a
3 31.928297 a
4 25.886745 a
5 93.288743 a
6 23.496359 a
y
elevbin Winter
1 0 to 10 12.51486
2 10 to 20 14.14977
3 20 to 30 10.19768
4 30 to 40 12.63925
5 40 to 50 10.18445
6 50 to 60 10.91821
7 60 to 70 13.00326
8 70 to 80 11.89128
9 80 to 90 13.88241
10 90 to 100 12.33358
所以我希望我的结果是:
head(x)
e lettertype Winter
1 5.801268 a 12.51486
2 99.115869 a 12.33358
3 31.928297 a 12.63925
4 25.886745 a 10.19768
5 93.288743 a 12.33358
6 23.496359 a 10.19768
简单来说,我想根据高程分档的温度为数据帧x中的每个高程(e)分配正确的温度。
目前,代码返回一个长度为1100000的向量,其中包含NA和冬季向量中的第一个数字,这是不正确的。结果应与x数据帧的长度相同。
任何帮助都会很棒!提前致谢!
答案 0 :(得分:0)
不需要for
循环或ifelse
。如果您先创建适当的列,则可以merge
这两个数据框:
elevation <- seq(0, 100, 10)
e <- c(seq(0, 99, 1))
elev_floor <- 10 * floor(e / 10)
x <- data.frame(e, elev_floor)
Winter <- runif(n=10, min=10, max=15)
Spring <- runif(n=10, min=12, max=16)
Summer <- runif(n=10, min=14, max=20)
Fall <- runif(n=10, min=11, max=16)
elevbin <- c("0 to 10", "10 to 20", "20 to 30", "30 to 40", "40 to 50",
"50 to 60", "60 to 70", "70 to 80", "80 to 90", "90 to 100")
elev_floor <- seq(0, 90, 10)
y <- data.frame(elevbin, elevmin, Winter, Spring, Summer, Fall)
merge(x, y)
结果:
e elev_floor elevbin elevmin Winter Spring Summer Fall
1 0 0 0 to 10 0 12.53781 13.01907 16.74989 15.22208
2 1 0 0 to 10 0 12.53781 13.01907 16.74989 15.22208
3 2 0 0 to 10 0 12.53781 13.01907 16.74989 15.22208
4 3 0 0 to 10 0 12.53781 13.01907 16.74989 15.22208
5 4 0 0 to 10 0 12.53781 13.01907 16.74989 15.22208
6 5 0 0 to 10 0 12.53781 13.01907 16.74989 15.22208
7 6 0 0 to 10 0 12.53781 13.01907 16.74989 15.22208
8 7 0 0 to 10 0 12.53781 13.01907 16.74989 15.22208
9 8 0 0 to 10 0 12.53781 13.01907 16.74989 15.22208
10 9 0 0 to 10 0 12.53781 13.01907 16.74989 15.22208
11 10 10 0 to 10 0 12.53781 13.01907 16.74989 15.22208
12 11 10 0 to 10 0 12.53781 13.01907 16.74989 15.22208
13 12 10 0 to 10 0 12.53781 13.01907 16.74989 15.22208
14 13 10 0 to 10 0 12.53781 13.01907 16.74989 15.22208
如果你的垃圾箱比你的例子更复杂,那么你可以调整x$elev_floor
的计算。