如何计算具有不同曝光时间的一系列数据的平均值

时间:2014-11-04 04:25:17

标签: r

有人可以帮忙吗?我是R和数据分析的新手。

我试图计算不同地区空气污染浓度的平均暴露水平。这里我有两个数据集:(1)污染物; (2)曝光期。他们的格式如下所示:

(1) Pollutant
pollutant  district  Jun-1996  Jul-1996 ........... Apr-1997 May-1997
  SO2         A         50        45                   56       60
  SO2         B         41        43                   50       42
  SO2         C         ..........................................
  NO2         A          ..........................................
  NO2         B           ..........................................
  NO2         C          ..........................................
  ... 


(2)Exposure period
ID   district     start      end
1       A        Jun-1996   Apr-1997  
2       A        Aug-1996   Apr-1997
3       C        Jul-1996   May-1997
4       B        Sep-1996   Apr-1997
5       C        Aug-1996   May-1997
...
...
...

我想要计算的是每种污染物的每种污染物的平均暴露程度,在身份证曝光期间,以及身份证所在的特定地区。

以第一个ID为例:

He is exposed to SO2, NO2  
He got exposed during Jun-1996 to Apr-1997
He lived in District A

因此,理想的结果将是:

ID  SO2_ave  NO2_ave
1      xx      xx
2
3

因此,经过计算,我可以将平均值作为新列添加到Exposure数据集中。

非常感谢!!!

0 个答案:

没有答案