美国人口普查制图边界文件的字符编码

时间:2010-03-19 12:51:34

标签: unicode encoding character shapefile census

我正在尝试将美国人口普查制图边界文件(此处为http://www.census.gov/geo/www/cob/bdy_files.html)导入GeoDjango应用程序。但是,python抱怨UnicodeDecodeErrors(例如,对于波多黎各的非ascii字符)。

shapefile描述文件(* .dbf)没有指定它使用的字符编码;这不是由shapefile规范定义的。使用什么是正确的字符编码?

2 个答案:

答案 0 :(得分:2)

我在2010年人口普查全几何形状的CBSA和Place数据方面遇到了同样的问题。这些不是剪辑的carto文件。

IBM850对我来说无法正常工作。一时兴起,我尝试了latin1,它运作得很好。

答案 1 :(得分:1)

美国人口普查制图边界文件使用IBM850字符编码。正确编码这些字符串的Python代码如下:

unicode(featurestring.decode("IBM850"))