首先:我正在使用众所周知的(并且经过测试我认为)flickrapi。我正在测试flickr照片与我的项目的同步,一切正常,直到我达到一些特定的文件。然后python的xml解析器无法将xml解析为字符串(以及来自主题的错误)。 Debug给了我xml中的行和列,所以我把它导出到了一个文件:
<exif tagspace="IFD0" tagspaceid="0" tag="Copyright" label="Copyright">
<raw>©Etienne-Follet.com</raw>
<clean>©Etienne-Follet.com</clean>
</exif>
错误位于<clean>©Etienne-Follet
列错误 <clean
的第>©...
行。谁能在这一行看到任何奇怪的东西?此外,本集/作者的每张照片都会崩溃。也许它与某些特殊字符有某种联系?以下是无法解析的示例集的链接:
http://www.flickr.com/photos/rte-france/sets/72157623592737564/
答案 0 :(得分:1)
无法解决:http://bitbucket.org/sybren/flickrapi/issue/11/encoding-issues。看起来这是一个flickr的副作用,他们不会很快解决它。
答案 1 :(得分:0)
我想你必须用UTF-8编码所有内容,所以确保它是这样的。