我有两个数据集-一个包含污染数据(5,850,000行,4列),基于英国国家网格,其粒度为20m x 20m。另一个-是从UK Wards多边形(8,949行,6列)中提取的数据集,其中包含相应的Wards的东,北坐标。
我希望将相应的Ward附加到污染数据集,以便随后进行透视并得出这些Ward中的平均污染。
我对此完全感到困惑。我能以某种方式使用Wards数据集作为查询,使用Easting和Northing网格,然后将其应用于污染数据集吗?谁能指出我正确的方向?
这是两组的主要输出:
污染:
x y conct year
0 501460 170580 29.56267 2016
1 501460 170600 29.70013 2016
2 501460 170620 29.83565 2016
3 501460 170640 29.97066 2016
4 501460 170660 30.10642 2016
围场:
Ward Code Ward bng_e bng_n st_areasha st_lengths
0 E05000026 Abbey 544434.0 184378.0 1247619.421 7858.341145
1 E05000027 Alibon 549247.0 185196.0 1355410.730 6246.797017
2 E05000028 Becontree 546863.0 185869.0 1289740.665 6280.315821
3 E05000029 Chadwell Heath 548266.0 189340.0 3382297.063 9496.484608
4 E05000030 Eastbrook 550774.0 186272.0 3449511.083 8857.773001
是否有一种方法可以根据x / y列和bng_e / bng_n将Ward名称合并到污染数据框中?