pykml和utf8:输入不正确,或者我没有得到它

时间:2016-10-21 15:38:10

标签: python utf-8

我有一个来自www的kmz文件,希望使用pykml将其读入csv等。 该文件采用UTF8格式,或至少声称为 - 请参阅下面的标题。阅读它有效,但在第一个重音字符时会触发错误。

<?xml version='1.0' encoding='UTF-8'?>
<kml xmlns='http://www.opengis.net/kml/2.2'>
 <Document>
   <name>

from pykml import parser
with open(KMZFIL) as f:
 folder=parser.parse(f).getroot().Document.Folder
for pm in folder.Placemark:
 print(pm.name)

Ablitas (militar) (Emerg)
Ademuz (forestal)
Ager (PL%)
Alcala del Rio (ILIPA MAGNA)(Esc.)
Traceback (most recent call last):
  File "bin4/b21_xxxxxxx", line 15, in <module>
    print(pm.name)

grep "name" $INFIL | head -7
 ( ... )
   <name>Ablitas (militar) (Emerg)</name>
   <name>Ademuz (forestal)</name>
   <name>Ager (PL%)</name>
   <name>Alcala del Rio (ILIPA MAGNA)(Esc.)</name>
   <name>Ainzón</name>

2 个答案:

答案 0 :(得分:0)

您需要以指示Python将字节解释为UTF-8字符的方式打开文件。在Python 2.7中,您可以使用 codecs module

import codecs
with codecs.open(KMZFIL, encoding='utf-8') as f:

在Python 3中,encoding选项已添加到标准open中,因此无需使用codecs

答案 1 :(得分:0)

在这里看不到答案,但是这些是lmxl StringElements-我使用.text来解决此错误。

将print(pm.name)更改为print(pm.name.text)

https://lxml.de/api/lxml.objectify.StringElement-class.html