Question

我正在尝试将美国人口普查制图边界文件（此处为http://www.census.gov/geo/www/cob/bdy_files.html）导入GeoDjango应用程序。但是，python抱怨UnicodeDecodeErrors（例如，对于波多黎各的非ascii字符）。

shapefile描述文件（* .dbf）没有指定它使用的字符编码;这不是由shapefile规范定义的。使用什么是正确的字符编码？

Answer 1

我在2010年人口普查全几何形状的CBSA和Place数据方面遇到了同样的问题。这些不是剪辑的carto文件。

IBM850对我来说无法正常工作。一时兴起，我尝试了latin1，它运作得很好。

Answer 2

美国人口普查制图边界文件使用IBM850字符编码。正确编码这些字符串的Python代码如下：

unicode(featurestring.decode("IBM850"))