我有以下data.table
:
Month Day Lat Long Temperature
1: 10 01 80.0 180 -6.383330333333309
2: 10 01 77.5 180 -6.193327999999976
3: 10 01 75.0 180 -6.263328333333312
4: 10 01 72.5 180 -5.759997333333306
5: 10 01 70.0 180 -4.838330999999976
---
117020: 12 31 32.5 310 11.840003833333355
117021: 12 31 30.0 310 13.065001833333357
117022: 12 31 27.5 310 14.685003333333356
117023: 12 31 25.0 310 15.946669666666690
117024: 12 31 22.5 310 16.578336333333358
对于每个地点(由Lat
和Long
给出),我在10月1日至12月31日期间每天都有温度。
Lat
Lat
1 80.0
2 77.5
3 75.0
4 72.5
5 70.0
--------
21 30.0
22 27.5
23 25.0
24 22.5
和Long
:
Long
1 180.0
2 182.5
3 185.0
4 187.5
5 190.0
---------
49 300.0
50 302.5
51 305.0
52 307.5
53 310.0
我尝试创建一个由{1,2}行(每个位置一个)和92列(每天一个)组成的data.table
。然后,data.table
的每个元素将包含当天该位置的温度。
关于如何在不使用for
循环的情况下实现该目标的任何建议?
答案 0 :(得分:5)
这里我们使用ChickWeights
作为数据,我们使用“Chick-Diet”作为“lat-lon”的等价物,将“Time”作为“Date”:
dcast.data.table(data.table(ChickWeight), Chick + Diet ~ Time)
产地:
Chick Diet 0 2 4 6 8 10 12 14 16 18 20 21
1: 18 1 1 1 NA NA NA NA NA NA NA NA NA NA
2: 16 1 1 1 1 1 1 1 1 NA NA NA NA NA
3: 15 1 1 1 1 1 1 1 1 1 NA NA NA NA
4: 13 1 1 1 1 1 1 1 1 1 1 1 1 1
5: ... 46 rows omitted
您的公式可能需要lat + lon ~ Month + Day
或其他类似内容。
将来,请像我在这里使用内置数据集一样提出问题 reproducible 。
答案 1 :(得分:0)
首先使用lubridate
包创建日期值(我假设年份= 2014,根据需要进行调整):
library(lubridate)
df$datetext <- paste(df$Month,df$Day,"2014",sep="-")
df$date <- mdy(df$datetext)
然后一个选项是使用tidyr
包来扩展列:
library(tidyr)
spread(df[,-c(1:2,6)],date,Temperature)
Lat Long 2014-10-01 2014-12-31
1 22.5 310 NA 16.57834
2 25.0 310 NA 15.94667
3 27.5 310 NA 14.68500
4 30.0 310 NA 13.06500
5 32.5 310 NA 11.84000
6 70.0 180 -4.838331 NA
7 72.5 180 -5.759997 NA
8 75.0 180 -6.263328 NA
9 77.5 180 -6.193328 NA
10 80.0 180 -6.383330 NA