使用SQLAlchemy查找周界内的经度和纬度

时间:2015-01-16 14:04:20

标签: python mysql sqlalchemy latitude-longitude

我正在使用SQLalchemy来定义我的表。这些表描述了地震事件,这些事件按事件,原点,幅度,实数量和时间量等排列。他们很好地遵循QuakeML的标准。 Event表是通过.preferredOriginID和.publicID与Origin的关系,Origin是通过.latitude_id和.id与Real_Quantity的关系。

我想找到指定半径范围内的所有经度和纬度,但问题是纬度和经度都在同一个Real_Quantity列中,而Origin表是指定哪些不同。

这是我想要实现的代码,但它在MySQL中

SELECT
    id,
    (
        acos(
            (
                cos(radians(37))
                * cos(radians(lat))
                * cos(radians(lng) - radians(-122))
            )
          + (
                sin(radians(37))
                * sin(radians(lat))
            )
        ) * 3959
    ) AS distance
FROM markers
HAVING distance < 25
ORDER BY distance
LIMIT 0, 20;

这就是我所做的,但只有你可以使用纬度,我想用经度纬度

z = self.session.query(Event) \
    .join(Origin) \
    .join(RealQuantity, Origin.latitude) \
    .filter(
        Event.preferredOriginID == Origin.publicID,
        RealQuantity.id == Origin.latitude_id
    ) \
    .group_by(Event, Origin.latitude, RealQuantity.value) \
    .having(func.cos(RealQuantity.value) < 50)

事件: ID | publicID | preferredOriginID | preferredMagnitudeID |输入| ....

产地: ID | publicID | time_id | latitude_id | longitude_id | depth_id | ...

Real_Quantity: ID |价值| ....

Origin只是指针,其值在Real_Quantity

我的模特是:

class Event(Base):
__tablename__ = 'event'

id = Column(Integer, primary_key=True) 
publicID = Column(String)

preferredOriginID = Column(String)
preferredMagnitudeID = Column(String)

type = Column(String)  
typeCertainty = Column(String)

creationInfo_id = Column(Integer, ForeignKey('creation_info.id'))
creationInfo = relationship(CreationInfo, backref=backref('event', uselist=False))


class Origin(Base):
__tablename__ = 'origin'

id = Column(Integer, primary_key=True)
publicID = Column(String)

time_id = Column(Integer, ForeignKey('time_quantity.id'))
time = relationship(TimeQuantity, backref=backref('origin', uselist=False))

latitude_id = Column(Integer, ForeignKey('real_quantity.id'))
latitude = relationship(RealQuantity, foreign_keys=[latitude_id]
                        , backref=backref('origin_lat', uselist=False))

longitude_id = Column(Integer, ForeignKey('real_quantity.id'))
longitude = relationship(RealQuantity, foreign_keys=[longitude_id]
                         , backref=backref('origin_lon', uselist=False))

depth_id = Column(Integer, ForeignKey('real_quantity.id'))
depth = relationship(RealQuantity, foreign_keys=[depth_id],
                     backref=backref('origin_depth', uselist=False))

creationInfo_id = Column(Integer, ForeignKey('creation_info.id'))
creationInfo = relationship(CreationInfo, backref=backref('origin', uselist=False))

event_id = Column(Integer, ForeignKey('event.id'))
event = relationship('Event', backref=backref('origin', uselist=True))


class RealQuantity(Base):
__tablename__ = 'real_quantity'
id = Column(Integer, primary_key=True)
value = Column(Float)
uncertainty = Column(Float)
lowerUncertainty = Column(Float)
upperUncertainty = Column(Float)
confidenceLevel = Column(Float)

1 个答案:

答案 0 :(得分:2)

不是解决方案(还),只是一些评论:

对于每个查询,您正在对Origin表中的每个条目执行复杂计算。随着条目数量的增加,这将变得非常缓慢(计算成本很高)。

想一想投射在地球上的圆(x=lon, y=lat, r=distance)。您可以轻松计算最小和最大纬度;最小和最大经度也可以完成,虽然数学有点棘手。

如果您已经按纬度和经度正确索引了Origin表格,那么您可以在min_lat <= lat <= max_lat and min_lon <= lon <= max_lon上进行非常快速(计算上便宜)的初始框选择,这应该可以轻松地丢弃99%的条目(取决于半径和原点的聚类);其余条目应该有大约80%的机会属于您想要的数据集,您只需要对其余条目运行昂贵的计算。

我强烈建议将其写为存储过程。