将长熊猫数据帧转换为numpy二维矩形数组

时间:2020-05-06 20:05:45

标签: python pandas numpy geohashing

我在熊猫数据框中具有以下内容:

z | x | y | hash
_________________
a | 0.0 | 1.0 | abcd
b | 1.0 | 1.0 | efghj
c | 1.0 | 0.0 | iklmno
d | 0.0 | 0.0 | pqrs

(其中Z代表数字高程,x和y为经度,长度,而哈希为geohash)

为了找到最接近的n个geohash位置,我想将其转换为2d numpy数组,以便将该位置保留在数组的结构中:

[["pqrs","abcd"],
["iklmno","efghj"]]

原始数据帧的长度超过2,000,000个条目,并且是对形状为(7875,14644)的栅格进行地理哈希处理的结果。

在哈希处理过程中丢失了一些信息,因此我不能简单地将数据帧转换为numpy数组并使用numpy.reshape()。我已经尝试过涉及numpy.meshgrid()的解决方案(详细说明Here),但是我的系统没有足够的内存来容纳网格对象。

我也尝试过使用“ r”光栅化数据框,但是这使我的系统崩溃了。

任何建议都将大有帮助!谢谢SO社区

0 个答案:

没有答案