如何处理数据集中的地理位置列

时间:2019-04-21 15:31:06

标签: python pandas machine-learning geolocation

我正在预测内收可能性药物。我在“地理位置”列中遇到了一些问题,并且我也不知道如何使用“地理位置”,请帮助我如何显示特定位置的人群的概率。 我的专栏是这样的:  这是我的googlecolab链接:https://colab.research.google.com/drive/1qM8LkkVex6cHRVXwqI40b44ofk7CmQVi

   train['GeoLocation'].head(8)
     0                      (29.760427, -95.369803)
1                      (29.760427, -95.369803)
2    (39.493240390000494, -117.07184056399967)
3      (40.79373015200048, -77.86070029399963)
4                      (37.77493, -122.419416)
5                      (39.952584, -75.165222)
6                     (32.715738, -117.161084)
7    (39.360700171000474, -111.58713063499971)
Name: GeoLocation, dtype: object

1 个答案:

答案 0 :(得分:-1)

我假设您正在使用Pandas数据框存储地理位置。如果您想对坐标进行操作(例如,两点之间的距离,最近的城市,地址提取等),则可以直接使用python client library to access Google Maps APIs,也可以使用一些包装器库轻松执行简单的任务。您也可以查看其他地图服务,但是IMO和过去的经验中,谷歌地图最为精确。

P.S。请提供问题的更多详细信息。您到底想做什么?

我想您已经知道这一点,地理位置字段由-(纬度,经度)组成,可以精确存储所需的位置。