自从我开始使用Pandas DataFrame反序列化GPS数据并执行一些数据处理和分析以来,已经有几个月了。
虽然我对Pandas的稳健性,灵活性和强大能力印象深刻,但我对于哪些功能有点迷失,以及在哪种方式下,我应该使用正确的数据建模,以保持清晰,简单和计算速度。 / p>
基本上,每个DataFrame主要由一个datetime
对象编制索引,至少有一列用于纬度 - 经度元组,一列用于高程。
我要做的第一件事是使用一个以两个坐标对作为参数的函数计算一个坐标对之间的测地距离(第一个为0.0)的新列,并从该新列我可以计算累积距离沿轨道,我用作Linear Referencing System
我需要解决的问题是:
diff
函数的特定情况下(应用类似于数组操作而不是迭代成对循环),有没有办法在pandas中以惯用方式执行此操作?我应该创建一个支持diff(__sub__
)操作的“坐标”类,这样我可以直接使用dataframe.latlng.diff
吗?我不确定这些问题是否制定得很好,但这至少应该是由于绝大多数的可能性,以及一些有些碎片化的文件(还有)。
此外,关于将Pandas用于GPS数据(轨道日志)或地理空间数据的任何提示都非常受欢迎。
感谢您的帮助!