有人可以帮忙吗?我是R和数据分析的新手。
我试图计算不同地区空气污染浓度的平均暴露水平。这里我有两个数据集:(1)污染物; (2)曝光期。他们的格式如下所示:
(1) Pollutant
pollutant district Jun-1996 Jul-1996 ........... Apr-1997 May-1997
SO2 A 50 45 56 60
SO2 B 41 43 50 42
SO2 C ..........................................
NO2 A ..........................................
NO2 B ..........................................
NO2 C ..........................................
...
(2)Exposure period
ID district start end
1 A Jun-1996 Apr-1997
2 A Aug-1996 Apr-1997
3 C Jul-1996 May-1997
4 B Sep-1996 Apr-1997
5 C Aug-1996 May-1997
...
...
...
我想要计算的是每种污染物的每种污染物的平均暴露程度,在身份证曝光期间,以及身份证所在的特定地区。
以第一个ID为例:
He is exposed to SO2, NO2
He got exposed during Jun-1996 to Apr-1997
He lived in District A
因此,理想的结果将是:
ID SO2_ave NO2_ave
1 xx xx
2
3
因此,经过计算,我可以将平均值作为新列添加到Exposure数据集中。
非常感谢!!!