使用python simplekml的UnicodeEncodeError

时间:2013-06-27 23:19:02

标签: google-maps python-2.7

我尝试从xlsx文件创建kml,但是当xlsx包含utf-8时,它无法正常工作。

我看到了simplekml文档并将其标记为已解决,但我无法使其正常工作。

我已经尝试将编码设置为ascii,也使用了django的smart_str和smart_unicode,但直到现在都没有用。

我正在使用openpyxl

读取文件
def create_kml(input_file,sheet_name,output_file,lat_column = 0,lng_column = 1):

    kml = simplekml.Kml()
    wb_read = load_workbook(input_file)
    sh = wb_read.get_sheet_by_name(sheet_name)

    properties = []
    for c in sh.rows[0]:
        properties.append(c.value.encode('utf-8'))

    for p,row in enumerate(sh.rows[1:]):
        for k,c in enumerate(row):
            if k==0:
                coord_tuple = (row[lng_column].value,row[lat_column].value)
                pnt = kml.newpoint(name = 'Point %s' % p, coords =[coord_tuple])
            #TODO: It's not working with unicode and utf-8
            if k != lat_column and k != lng_column:
                if type(row[k].value) == unicode or type(row[k].value) == str:
                    pnt.extendeddata.newdata(properties[k],row[k].value.encode('utf-8'))

    kml.save(output_file)

回溯:

    Traceback (most recent call last):
    File "<console>", line 1, in <module>
    File "C:/Users/Fernando Alves/Dropbox/Projetos/utils.py", line 296, in create_kml
    kml.save(output_file)
    File "C:\Python27\lib\site-packages\simplekml\kml.py", line 285, in save
    out = self._genkml(format)
    File "C:\Python27\lib\site-packages\simplekml\kml.py", line 198, in _genkml
    kml_str = self._feature.__str__()
    File "C:\Python27\lib\site-packages\simplekml\featgeom.py", line 418, in __str__
    buf.append(feat.__str__())
    File "C:\Python27\lib\site-packages\simplekml\featgeom.py", line 414, in __str__
    buf.append(super(Feature, self).__str__())
    File "C:\Python27\lib\site-packages\simplekml\base.py", line 54, in __str__
    buf.append(u("<{0}>{1}</{0}>").format(var, val))  # Enclose the variable's __str__ with its name
    UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 33: ordinal not in range(128)

2 个答案:

答案 0 :(得分:1)

我自己正在处理这个问题,但它出现在一些制表符分隔的数据中,我用它来使用simplekml在KML中构建地标。问题的主要原因是所谓的制表符分隔文本包含一些高阶字符。它们在被解析时被复制到地标的描述字段中。保存KML文件时,会发生此错误。

两年前在simplekml问题论坛中讨论了这个问题: http://code.google.com/p/simplekml/issues/detail?id=10

有趣的是,那里描述的解决方案被接受发布(响应#6),不是通过pip可用的当前版本的simplekml。此外,当我在本地应用补丁时,它没有任何区别。 base.py中出现相同的unicode解码错误。

我可以通过在simplekml赋值和方法中使用它之前添加代码来过滤制表符分隔文本来解决我的具体情况。总而言之,simplekml在其字符串中需要兼容ascii的文本字符。

答案 1 :(得分:1)

我找到了解决方案,但您必须更改simplekml库...

这些是您要更改的文件:

/usr/local/lib/python2.7/dist-packages/simplekml/base.py
/usr/local/lib/python2.7/dist-packages/simplekml/kml

/usr/local/lib/python2.7/dist-packages/simplekml/base.py

  • 在第一个文件中,您必须删除函数 u 的每次出现。它存在于以下行中: 46,54,257,259

/usr/local/lib/python2.7/dist-packages/simplekml/kml

  • 在第二个文件中,您必须更改第209行kml_str = xml.dom.minidom.parseString(xml_str.encode("utf-8")) 进入这个: kml_str = xml.dom.minidom.parseString(xml_str)

  • 此外,您必须删除函数的所有内容 u

如果问题仍然存在,请按照调试器删除函数 u 的每一次出现,它应该可以正常工作!

我尝试更改功能,但它无效... 如果您找到解决方案,请告诉我们!