在R中为不同年份的数据分配坐标?

时间:2017-11-08 10:33:40

标签: r coordinates spatial geostatistics

我从2012年获得了德国的数据框,其中8187行为8187邮政编码(大约10个变量列为列),但没有坐标。另外,我有一个不同shapefile的坐标,有8203行(也包括大部分相同的邮政编码)。

我需要将8203个案例的正确坐标分配给初始数据帧的8178个案例。

问题:所需的正确分配的差异不是8178,缺少16个案例(8203 - 8187 = 16),它更多。 2012年有一些城镇(邮政编码)没有在最新的shapefile中列出,反之亦然。

(I)也许最简单的解决方案是从2012年获得坐标(未投影:CRS(“+ init = epsg:4326”))。 - >有没有人知道这个目的的开源平台?他们有8187邮政编码吗?

(II)或者:有没有人有从不同年份的数据集中分配坐标的经验? - 或者,是否应该以任何方式避免这种情况,因为边界和坐标略有变化(特别是当数据应该从2012年的多边形中映射和可视化时)和一些未列入较新数据集中较旧“和”的城镇?

我很感激您就如何处理(并希望解决)这个问题提出专家意见!

亲切的问候!

编辑 - MWE:

# data set from 2012
> df1
# A tibble: 9 x 4
     ID  PLZ5          Name  Var1
  <dbl> <dbl>         <chr> <dbl>
1     1  1067 Dresden 01067    40
2     2  1069 Dresden 01069   110
3   224  4571         Rötha     0
4   225  4574       Deutzen   120
5   226  4575 Neukieritzsch   144
6   262  4860        Torgau    23
7   263  4862     Mockrehna    57
8  8186 99996     Menteroda     0
9  8187 99998        Körner    26

# coordinates of recent shapefile   
> df2
# A tibble: 9 x 5
     ID  PLZ5          Name Longitude Latitude
  <dbl> <dbl>         <chr>     <dbl>    <dbl>
1     1  1067 Dresden-01067  13.71832 51.06018
2     2  1069 Dresden-01069  13.73655 51.03994
3   224  4571        Roetha  12.47311 51.20390
4   225  4575 Neukieritzsch  12.41355 51.15278
5   260  4860        Torgau  12.94737 51.55790
6   261  4861     Bennewitz  13.00145 51.51125
7   262  4862     Mockrehna  12.83097 51.51125
8  8202 99996    Obermehler  10.59146 51.28864
9  8203 99998       Koerner  10.55294 51.21257

因此,

4   225  4574       Deutzen   120

- &GT;未列在df2和:

6   261  4861     Bennewitz  13.00145 51.51125

- &GT;未在df1中列出。

关于(I)和(II)的任何想法?

0 个答案:

没有答案