我有两个数据帧。第一个包含经度和纬度点的列表,以及与在这些坐标处的人相关的ID号以及它们所在的日期。第二个具有某些商店的名称(总计约1000个)和用于概述与每个商店关联的多边形的坐标。我想以某种方式在scala(数据块)中加入这两者,以获取在一定时间内访问每个地方的次数。
我试图简单地将两个数据框连接起来,但是,因为多边形数据有几个点,其中仅包含概述多边形的信息,所以这是行不通的。我需要每个多边形内的点数(纬度和经度)。
+-------------+----------------+
|ID| latitude |longitude| date |
+-------------+----------------+
|1 | xx | yy |1/1/18|
|2 | xx | yy |1/2/18|
|3 | xx | yy |1/1/18|
|3 | xx | yy |1/3/18|
|3 | xx | yy |1/1/18|
|4 | xx | yy |1/5/18|
|5 | xx | yy |1/5/18|
|5 | xx | yy |1/5/18|
+-------------+----------------+
+-------------+-----------------------+
|location_name|polygon |
+-------------+-----------------------+
|Location1 |POLYGON((x y, x y,...))|
|Location2 |POLYGON((x y, x y,...))|
|Location3 |POLYGON((x y, x y,...))|
|Location4 |POLYGON((x y, x y,...))|
|Location5 |POLYGON((x y, x y,...))|
|Location6 |POLYGON((x y, x y,...))|
|Location7 |POLYGON((x y, x y,...))|
|Location8 |POLYGON((x y, x y,...))|
+-------------+------------------------+
我只想获取每个位置的访问次数-来自第二个数据框的每个多边形中的第一个数据框的点数。