用于给定名称流行度的API

时间:2011-08-26 18:22:58

标签: api

我想知道一个名字在美国有多受欢迎,最好是按等级排名,但有这个名字的人数也会很好。

The Social Security Administration keeps records of baby names going back to 1879。可能有一种方法可以确定人口中某个名字的整体频率,但我决定在某一年内获得一个名字的等级,并将其用作一个(有缺陷的)人气代理。

这可以通过their site实现,所以我想只需解析正确的POST请求的结果就可以了。

目前我刚刚开始运行:

curl -d "year=2010&top=1000&number=p" http://www.ssa.gov/cgi-bin/popularnames.cgi > 2010_top_1000.html

然后解析html,并在生成的文件中进行查找。

有更好的方法吗?

更新 使用上述方法可以获得的大多数名称是1000.您可以在此处获取频率超过5个名称的婴儿名称作为zip文件:http://www.ssa.gov/oact/babynames/limits.html

1 个答案:

答案 0 :(得分:2)

美国人口普查局在1990年想到了完全相同的事情,然后他们发表了这个:http://www.census.gov/genealogy/names/names_files.html

不幸的是,我不认为他们对2000年或2010年的数据做过同样的事情。