PostgreSQL - OSM数据上非常慢的表连接

时间:2016-03-21 11:03:18

标签: postgresql openstreetmap postgis

我在创建表连接时遇到问题。查询永远运行。我在一张桌子上打开了街道地图自行车路线,并且具有所有属性。

Table planet_osm_line
osm_id bigint,
route text,
name text,
network text,
osmc_color text,
reversed text,
state text,
"instance:cycle" text,
"relation:id" text,
ref text,
description text,
distance text,
tags hstore,
way geometry(LineString,900913)

有些行是重复的(一条路上有2条或更多条路线)所以我将唯一的行过滤到另一个表中,我尝试将它们与planet_osm_line的数据合并:

DROP TABLE  IF EXISTS  public.bicycle_merge;
CREATE TABLE public.bicycle_merge AS

WITH singleRow as ( 
   select count(way), way
   from planet_osm_line 
   WHERE route IN ('bicycle')
   group by way
   having count(way) = 1
)
SELECT P.*
FROM planet_osm_line P
JOIN singleRow S
  ON P.way = S.way
;

此查询永远运行....原谅我的新手问题,但我做错了什么?

"Nested Loop  (cost=28767.43..172920474.87 rows=5892712 width=335)"
"  Join Filter: (p.way = s.way)"
"  CTE singlerow"
"    ->  GroupAggregate  (cost=27040.24..28767.43 rows=76764 width=218)"
"          Filter: (count(planet_osm_line1.way) = 1)"
"          ->  Sort  (cost=27040.24..27232.15 rows=76764 width=218)"
"                Sort Key: planet_osm_line1.way"
"                ->  Seq Scan on planet_osm_line1  (cost=0.00..4543.55     rows=76764 width=218)"

Planet_osm_line表有大约70,000行。独特的几何形状约为50.000。 此查询适用于一小组数据,但现在我正在处理整个国家(波兰)的自行车路线。非常感谢你提前!

1 个答案:

答案 0 :(得分:6)

您正在加入两个普通几何体。这意味着您要对所有可能的匹配之间的几何(字节,字节)进行二进制比较。这确实需要很长时间。在EXPLAIN ANALYZE中,CTE的费用为28,767;联接是因子6,000 更大。

相反,您应该测试两个几何是否相互接触(因为OSM是正确地理编码的,您可以假设没有线交叉点):

WITH singleRow AS ( 
   SELECT count(way), way
   FROM planet_osm_line 
   WHERE route IN ('bicycle')
   GROUP BY way
   HAVING count(way) = 1
)
SELECT P.*
FROM planet_osm_line P
JOIN singleRow S ON ST_Contains(P.way, S.way);

在您检索的行集上,您可以应用函数ST_MakeLine()将实际的较小行合并为一行。