postgres表中的最近点

时间:2019-02-12 15:09:05

标签: postgresql postgresql-9.4

当且仅当最近的表项位于10英里之内时,我才需要一些帮助来查找特定表的每个表项与另一个表的最近点。

2张桌子在这里:

Table A
lon | lat | block_id 

table B
 city        | latitude | longitude | block_id
-------------------+----------+-----------+----------

现在,我必须用距离该条目最近且在10英里之内的表B之一来更新表A的blockid。如果找不到匹配项,则可以将其更新为“ NA”。表A由一百万个条目组成,表B由10个条目组成。

我正在使用Postgres 9.4。我对Postgres相当陌生,因此虽然对sql相当满意,但对它却不太满意。

如有任何错误,请多包涵。非常感谢您的帮助,我感到很沮丧。

非常感谢

3 个答案:

答案 0 :(得分:0)

您可以使用几何类型创建字段列geom吗?使用ST_point更新。

那你就做

with cte as (
      SELECT A.geom, B.geom, B.block_id,
             ST_Distance(A.geom, B.geom) as dist -- check this value first
      FROM TableA as A
      CROSS JOIN TableB as B
      WHERE ST_Distance(A.geom, B.geom) < 16000 -- 10 miles
)
SELECT *
FROM  cte

编辑:

假设您的CTE有效,那么您可以找到最近的点

with cte as (
  ....
), sort as (
   SELECT *, row_number() over (partition by A.id order by dist) as  rn
   FROM cte
)
SELECT *
FROM sort 
WHERE rn = 1

答案 1 :(得分:0)

非常感谢Juan的帮助,这是我执行的步骤列表:

添加列

ALTER TABLE tableA
  ADD COLUMN geom
    geometry(Geometry,4326);

ALTER TABLE tableB
  ADD COLUMN geom
    geometry(Geometry,4326);

然后编辑表A中的geom列,与表B相同:

update tableA set geom=ST_SetSRID(ST_Point(lon, lat),4326)::geometry;

然后获取相应的block_id

with cte as (
      SELECT A.id, A.lat, A.lon, B.latitude, B.longitude, B.city, A.geom, B.geom, B.block_id,
             ST_Distance(A.geom::geography, B.geom::geography) as dist
      FROM tableA as A
      CROSS JOIN tableB as B
      WHERE ST_Distance(A.geom::geography, B.geom::geography) < 50000 -- for 50kms
) update tableA set block_id=cte.block_id from cte as cte where tableA.id=cte.id;

但是在上面的查询中添加额外的逻辑很不知所措:如果2个block_id匹配,我想选择最接近的block_id。

再次感谢, Sudip

答案 2 :(得分:0)

在“位置”字段上创建索引,并且位置字段具有点数据类型。

CREATE INDEX ON table_name USING GIST(location);

GiST索引能够优化“最近邻居”搜索:

SELECT * FROM table_name ORDER BY location <-> point '(-74.013, 40.711)' LIMIT 10;

注意:点的第一个元素是经度,第二个元素是纬度。