使用ACS R包为所有邮政编码提取人口普查数据并获得未来预测

时间:2016-01-26 12:59:21

标签: r census

关于如何最好地使用acs R包,我有几个问题。在此先感谢您的帮助。

  • 我想建立一个综合数据框,这是一个查找表,其中包含我可以从每个邮政编码的API获取的所有人口普查数据。目前我只使用R代码查找几个单独的表,如下例所示。是否有更好的方法来查找所有可用的表并自动构建数据表数据集并填充列名称?我知道acs.lookup函数,但我想加载所有表并获取其邮政编码的数据。有没有办法从acs.lookup输出中获取所有表的列表,或者可以获得可用表的完整列表?

  • 我还希望获得尽可能多的变量的未来投影数据。我想我可以使用多年(2014年,2013年,2012年,2011年)和2014年使用acs14lite R软件包计算我使用上述方法发现的预测。在我这样做之前,我想知道美国人口普查本身是否有未来预测使用这个ACS数据还是其他什么?

    创建用户指定的地理位置

    使用所有邮政编码

    zip_geo = geo.make(zip.code =“*”)

    创建竞赛数据框

    获取比赛数据

    race.data = acs.fetch(geography = zip_geo,table.number =“B03002”,                       col.names =“pretty”,endyear = 2013,span = 5)

    创建人口统计数据的数据框

    zip_demographics = data.frame(region = as.character(geography(race.data)$ zipcodetabulationarea),                               total_population = as.numeric(估计(race.data [,1])))

    zip_demographics $ region = as.character(zip_demographics $ region)

    转换为data.frame

    race_df = data.frame(white_alone_not_hispanic = as.numeric(estimate(race.data [,3])),                      black_alone_not_hispanic = as.numeric(估计(race.data [,4])),                      asian_alone_not_hispanic = as.numeric(估计(race.data [,6])),                      hispanic_all_races = as.numeric(估计(race.data [,12])))

    zip_demographics $ percent_white =(race_df $ white_alone_not_hispanic / zip_demographics $ total_population * 100) zip_demographics $ percent_black =(race_df $ black_alone_not_hispanic / zip_demographics $ total_population * 100) zip_demographics $ percent_asian =(race_df $ asian_alone_not_hispanic / zip_demographics $ total_population * 100) zip_demographics $ percent_hispanic =(race_df $ hispanic_all_races / zip_demographics $ total_population * 100)

1 个答案:

答案 0 :(得分:0)

您可以通过以下链接下载2010表壳中所有代码的副本。点击它后,它将开始下载和excel文件。

ACS Table Shells Download

我所做的是将此文档作为数据框加载,使用适当的代码格式化列,然后使用单元格地址示例:povertyNumerator<acsTable[781,2]来提取变量。

您无法完全自动化该流程,因为您需要决定如何突破&#39;类别&#39;回答并做你自己的数学,但除此之外你可以很快地使用这个表和一些acs包技能。