如何提高计算hasrsine公式的查询性能?

时间:2017-04-19 10:15:32

标签: performance postgresql location gis

给出一张有纬度和经度的位置表,哪些位置最接近给定位置?

当然,在地球表面找到距离意味着使用大圆距离,用Haversine公式计算,也称为球面余弦定律公式。

我有以下代码:

 SELECT zip, latitude, longitude, distance
 FROM (
  SELECT z.zip,
         z.latitude, z.longitude,
         p.radius,
         p.distance_unit
             * DEGREES(ACOS(COS(RADIANS(p.latpoint))
             * COS(RADIANS(z.latitude))
             * COS(RADIANS(p.longpoint - z.longitude))
             + SIN(RADIANS(p.latpoint))
             * SIN(RADIANS(z.latitude)))) AS distance
  FROM zip AS z
   JOIN (   /* these are the query parameters */
    SELECT  42.81 AS latpoint, -70.81 AS longpoint,
            50.0  AS radius,  111.045 AS distance_unit
        ) AS p ON 1=1
  WHERE z.latitude
    BETWEEN p.latpoint  - (p.radius / p.distance_unit)
        AND p.latpoint  + (p.radius / p.distance_unit)
   AND z.longitude
    BETWEEN p.longpoint - (p.radius / (p.distance_unit * COS(RADIANS(p.latpoint))))
        AND p.longpoint + (p.radius / (p.distance_unit * COS(RADIANS(p.latpoint))))
) AS d
WHERE distance <= radius

有没有办法改善此查询的效果?

是否有必要使用PostGIS来改进它,或者它只是我的半正式公式的包装?

3 个答案:

答案 0 :(得分:2)

此查询永远不会特别快。但是,有一些方法可以改进。

首先:此处不需要Haversine公式。只有当地球的曲率是一个重要因素或非常接近极点时,才需要进行修正。这两种情况都不是这样 - 需要精确计算的最大距离是12英里,这几乎不可能在地平线上。在这个尺度上,地球实际上是平坦的,因此毕达哥拉斯定理足以计算距离。

一度纬度约为69英里,在52°N(荷兰所在的地方),经度为cos(52°)x 69 = 42.5英里,因此公式变为:

  

sqrt(pow(69 *(lat - $ latitude),2)+ pow(42.5 *(lng - $ longitude),2))

第二:我们可以对纬度和经度使用“剪刀测试”。如果一个点在距离目标点的任何基本方向上超过12英里,那么它肯定不能在该点的12英里范围内。我们可以利用这个事实对纬度和经度进行快速比较,完全跳过距离计算。使用我们上面得出的一个纬度/经度的数字,我们有:

  

WHERE(lat BETWEEN($ latitude - 12 / 69.0)AND($ latitude + 12 / 69.0))   AND(lng BETWEEN($经度 - 12 / 42.5)和($经度+ 12 / 42.5))

请注意,这并不能取代全程检查!这只是快速抛出不可能在正确半径范围内的点的第一步。使用lat或lng上的索引,这将允许数据库服务器避免检查数据库中的许多行。

答案 1 :(得分:1)

我想计划程序会自己重写这个查询,但值得一试。至少它更整洁。

select zip, latitude, longitude, distance
from (
    select z.zip,
           z.latitude, z.longitude,
           p.radius,
           p.distance_unit
               * p.degrees_acos_cos_radians_latpoint
               * cos(radians(z.latitude))
               * cos(radians(p.longpoint - z.longitude))
               + p.sin_radians_latpoint
               * sin(radians(z.latitude)))) as distance
    from
        zip z
        cross join (
            select
                latpoint, longpoint, radius, distance_unit,
                latpoint - radius / distance_unit as lat0,
                latpoint + radius / distance_unit as lat1,
                longpoint - radius / distance_unit * cos(radians(latpoint)) as long0,
                longpoint + radius / distance_unit * cos(radians(latpoint)) as long1,
                sin(radians(latpoint)) as sin_radians_latpoint,
                degrees(acos(cos(radians(latpoint)) as degrees_acos_cos_radians_latpoint
            from (
                values (42.81, -70.81, 50.0, 111.045)
            ) v (latpoint, longpoint, radius, distance_unit)
        ) p
    where
        z.latitude between lat0 and lat1
        and
        z.longitude between long0 and long1
) d
where distance <= radius

答案 2 :(得分:0)

表达式不是缓慢的部分。问题是&#34;找到最近的&#34;难以使用索引来限制要查看的行数。

如果您在z上没有这些内容,那么他​​们会提供帮助:

INDEX(latitude),
INDEX(longitude)

如果您已经拥有它们,请确保子查询实际使用了其中一个。

下一步将更加激烈(并且更富有成效):http://mysql.rjweb.org/doc.php/latlng