我正在使用SQLalchemy来定义我的表。这些表描述了地震事件,这些事件按事件,原点,幅度,实数量和时间量等排列。他们很好地遵循QuakeML的标准。 Event表是通过.preferredOriginID和.publicID与Origin的关系,Origin是通过.latitude_id和.id与Real_Quantity的关系。
我想找到指定半径范围内的所有经度和纬度,但问题是纬度和经度都在同一个Real_Quantity列中,而Origin表是指定哪些不同。
这是我想要实现的代码,但它在MySQL中
SELECT
id,
(
acos(
(
cos(radians(37))
* cos(radians(lat))
* cos(radians(lng) - radians(-122))
)
+ (
sin(radians(37))
* sin(radians(lat))
)
) * 3959
) AS distance
FROM markers
HAVING distance < 25
ORDER BY distance
LIMIT 0, 20;
这就是我所做的,但只有你可以使用纬度,我想用经度纬度
z = self.session.query(Event) \
.join(Origin) \
.join(RealQuantity, Origin.latitude) \
.filter(
Event.preferredOriginID == Origin.publicID,
RealQuantity.id == Origin.latitude_id
) \
.group_by(Event, Origin.latitude, RealQuantity.value) \
.having(func.cos(RealQuantity.value) < 50)
事件: ID | publicID | preferredOriginID | preferredMagnitudeID |输入| ....
产地: ID | publicID | time_id | latitude_id | longitude_id | depth_id | ...
Real_Quantity: ID |价值| ....
Origin只是指针,其值在Real_Quantity
中我的模特是:
class Event(Base):
__tablename__ = 'event'
id = Column(Integer, primary_key=True)
publicID = Column(String)
preferredOriginID = Column(String)
preferredMagnitudeID = Column(String)
type = Column(String)
typeCertainty = Column(String)
creationInfo_id = Column(Integer, ForeignKey('creation_info.id'))
creationInfo = relationship(CreationInfo, backref=backref('event', uselist=False))
class Origin(Base):
__tablename__ = 'origin'
id = Column(Integer, primary_key=True)
publicID = Column(String)
time_id = Column(Integer, ForeignKey('time_quantity.id'))
time = relationship(TimeQuantity, backref=backref('origin', uselist=False))
latitude_id = Column(Integer, ForeignKey('real_quantity.id'))
latitude = relationship(RealQuantity, foreign_keys=[latitude_id]
, backref=backref('origin_lat', uselist=False))
longitude_id = Column(Integer, ForeignKey('real_quantity.id'))
longitude = relationship(RealQuantity, foreign_keys=[longitude_id]
, backref=backref('origin_lon', uselist=False))
depth_id = Column(Integer, ForeignKey('real_quantity.id'))
depth = relationship(RealQuantity, foreign_keys=[depth_id],
backref=backref('origin_depth', uselist=False))
creationInfo_id = Column(Integer, ForeignKey('creation_info.id'))
creationInfo = relationship(CreationInfo, backref=backref('origin', uselist=False))
event_id = Column(Integer, ForeignKey('event.id'))
event = relationship('Event', backref=backref('origin', uselist=True))
class RealQuantity(Base):
__tablename__ = 'real_quantity'
id = Column(Integer, primary_key=True)
value = Column(Float)
uncertainty = Column(Float)
lowerUncertainty = Column(Float)
upperUncertainty = Column(Float)
confidenceLevel = Column(Float)
答案 0 :(得分:2)
不是解决方案(还),只是一些评论:
对于每个查询,您正在对Origin表中的每个条目执行复杂计算。随着条目数量的增加,这将变得非常缓慢(计算成本很高)。
想一想投射在地球上的圆(x=lon, y=lat, r=distance)
。您可以轻松计算最小和最大纬度;最小和最大经度也可以完成,虽然数学有点棘手。
如果您已经按纬度和经度正确索引了Origin表格,那么您可以在min_lat <= lat <= max_lat and min_lon <= lon <= max_lon
上进行非常快速(计算上便宜)的初始框选择,这应该可以轻松地丢弃99%的条目(取决于半径和原点的聚类);其余条目应该有大约80%的机会属于您想要的数据集,您只需要对其余条目运行昂贵的计算。
我强烈建议将其写为存储过程。