我在熊猫数据框中具有以下内容:
z | x | y | hash
_________________
a | 0.0 | 1.0 | abcd
b | 1.0 | 1.0 | efghj
c | 1.0 | 0.0 | iklmno
d | 0.0 | 0.0 | pqrs
(其中Z代表数字高程,x和y为经度,长度,而哈希为geohash)
为了找到最接近的n个geohash位置,我想将其转换为2d numpy数组,以便将该位置保留在数组的结构中:
[["pqrs","abcd"],
["iklmno","efghj"]]
原始数据帧的长度超过2,000,000个条目,并且是对形状为(7875,14644)的栅格进行地理哈希处理的结果。
在哈希处理过程中丢失了一些信息,因此我不能简单地将数据帧转换为numpy数组并使用numpy.reshape()
。我已经尝试过涉及numpy.meshgrid()
的解决方案(详细说明Here),但是我的系统没有足够的内存来容纳网格对象。
我也尝试过使用“ r”光栅化数据框,但是这使我的系统崩溃了。
任何建议都将大有帮助!谢谢SO社区