从坐标检索人口普查区

时间:2018-07-24 13:06:14

标签: r api google-maps ggmap census

我有一个包含经度和纬度坐标的数据集。我想检索相应的人口普查区。是否有可以允许我执行此操作的数据集或api?

我的数据集如下:

       lat       lon   
1 40.61847 -74.02123   
2 40.71348 -73.96551   
3 40.69948 -73.96104    
4 40.70377 -73.93116   
5 40.67859 -73.99049   
6 40.71234 -73.92416   

我想添加一列带有相应的人口普查区域的记录。

最终输出应如下所示(这些不是正确的数字,仅是示例)。

       lat       lon     Census_Tract_Label   
1 40.61847 -74.02123                   5.01
2 40.71348 -73.96551                     20
3 40.69948 -73.96104                     41
4 40.70377 -73.93116                  52.02
5 40.67859 -73.99049                     58
6 40.71234 -73.92416                     60

1 个答案:

答案 0 :(得分:2)

tigris程序包包含一个名为call_geolocator_latlon的函数,该函数应该可以执行您想要的操作。这是一些使用

的代码
    > coord <- data.frame(lat = c(40.61847, 40.71348, 40.69948, 40.70377, 40.67859, 40.71234),
    +                     long = c(-74.02123, -73.96551, -73.96104, -73.93116, -73.99049, -73.92416))
    > 
    > coord$census_code <- apply(coord, 1, function(row) call_geolocator_latlon(row['lat'], row['long']))
    > coord
           lat      long     census_code
    1 40.61847 -74.02123 360470152003001
    2 40.71348 -73.96551 360470551001009
    3 40.69948 -73.96104 360470537002011
    4 40.70377 -73.93116 360470425003000
    5 40.67859 -73.99049 360470077001000
    6 40.71234 -73.92416 360470449004075

据我所知,这15位数字是几个数字的总和(前两个是州,接下来的三个是县,后面的六个是区域)。要仅获取人口普查区代码,我只需使用substr函数即可提取出这六个数字。

    > coord$census_tract <- substr(coord$census_code, 6, 1)
    > coord
           lat      long     census_code census_tract
    1 40.61847 -74.02123 360470152003001       015200
    2 40.71348 -73.96551 360470551001009       055100
    3 40.69948 -73.96104 360470537002011       053700
    4 40.70377 -73.93116 360470425003000       042500
    5 40.67859 -73.99049 360470077001000       007700
    6 40.71234 -73.92416 360470449004075       044900

希望对您有帮助!