当且仅当最近的表项位于10英里之内时,我才需要一些帮助来查找特定表的每个表项与另一个表的最近点。
2张桌子在这里:
Table A
lon | lat | block_id
和
table B
city | latitude | longitude | block_id
-------------------+----------+-----------+----------
现在,我必须用距离该条目最近且在10英里之内的表B之一来更新表A的blockid。如果找不到匹配项,则可以将其更新为“ NA”。表A由一百万个条目组成,表B由10个条目组成。
我正在使用Postgres 9.4。我对Postgres相当陌生,因此虽然对sql相当满意,但对它却不太满意。
如有任何错误,请多包涵。非常感谢您的帮助,我感到很沮丧。
非常感谢
答案 0 :(得分:0)
您可以使用几何类型创建字段列geom
吗?使用ST_point更新。
那你就做
with cte as (
SELECT A.geom, B.geom, B.block_id,
ST_Distance(A.geom, B.geom) as dist -- check this value first
FROM TableA as A
CROSS JOIN TableB as B
WHERE ST_Distance(A.geom, B.geom) < 16000 -- 10 miles
)
SELECT *
FROM cte
编辑:
假设您的CTE有效,那么您可以找到最近的点
with cte as (
....
), sort as (
SELECT *, row_number() over (partition by A.id order by dist) as rn
FROM cte
)
SELECT *
FROM sort
WHERE rn = 1
答案 1 :(得分:0)
非常感谢Juan的帮助,这是我执行的步骤列表:
添加列
ALTER TABLE tableA
ADD COLUMN geom
geometry(Geometry,4326);
ALTER TABLE tableB
ADD COLUMN geom
geometry(Geometry,4326);
然后编辑表A中的geom列,与表B相同:
update tableA set geom=ST_SetSRID(ST_Point(lon, lat),4326)::geometry;
然后获取相应的block_id
with cte as (
SELECT A.id, A.lat, A.lon, B.latitude, B.longitude, B.city, A.geom, B.geom, B.block_id,
ST_Distance(A.geom::geography, B.geom::geography) as dist
FROM tableA as A
CROSS JOIN tableB as B
WHERE ST_Distance(A.geom::geography, B.geom::geography) < 50000 -- for 50kms
) update tableA set block_id=cte.block_id from cte as cte where tableA.id=cte.id;
但是在上面的查询中添加额外的逻辑很不知所措:如果2个block_id匹配,我想选择最接近的block_id。
再次感谢, Sudip
答案 2 :(得分:0)
在“位置”字段上创建索引,并且位置字段具有点数据类型。
CREATE INDEX ON table_name USING GIST(location);
GiST索引能够优化“最近邻居”搜索:
SELECT * FROM table_name ORDER BY location <-> point '(-74.013, 40.711)' LIMIT 10;
注意:点的第一个元素是经度,第二个元素是纬度。