在Python

时间:2015-12-12 15:18:19

标签: python xml pastebin

我试图通过他们的API搜索Pastebin上的内容。我正在使用用于python的pastebin库进行搜索。

问题是我收到了一个带有重复键的XML响应。

这是回复

<paste>
<paste_key>fadsda</paste_key>
<paste_date>1409074286</paste_date>
<paste_title>badPaste</paste_title>
<paste_size>2040</paste_size>
<paste_expire_date>0</paste_expire_date>
<paste_private>0</paste_private>
<paste_format_long>Bash</paste_format_long>
<paste_format_short>bash</paste_format_short>
<paste_url>http://pastebin.com/url2</paste_url>
<paste_hits>211</paste_hits>
</paste>
<paste>
<paste_key>fsfgdsgg</paste_key>
<paste_date>1398409838</paste_date>
<paste_title>goodPaste</paste_title>
<paste_size>2407</paste_size>
<paste_expire_date>0</paste_expire_date>
<paste_private>2</paste_private>
<paste_format_long>Bash</paste_format_long>
<paste_format_short>bash</paste_format_short>
<paste_url>http://pastebin.com/otherURL</paste_url>
<paste_hits>54</paste_hits>
</paste>

所以我试图在paste_key时解析它以返回paste_title == goodPaste,但attrib始终为空

def parseXML(response):
    #I'm adding a root tag
    xml = ElementTree.fromstring('<list>' + response + '</list>')
    for child in root:
            for elem in child:
                print elem.tag, elem.attrib

返回

    paste_key {}
    paste_date {}
    paste_title {}
    paste_size {}
    paste_expire_date {}
    paste_private {}
    paste_format_long {}
    paste_format_short {}
    paste_url {}
    paste_hits {}
    paste_key {}
    paste_date {}
    paste_title {}
    paste_size {}
    paste_expire_date {}
    paste_private {}
    paste_format_long {}
    paste_format_short {}
    paste_url {}
    paste_hits {}

修改: 所以我应该使用elem.text,以便现在正在工作,但主要问题仍然存在: 如何在paste_key

时返回paste_title == goodPaste元素

编辑2 中奖票:

result = xml.findall(".//paste[paste_title='goodPaste']/paste_key")
print result[0].text

1 个答案:

答案 0 :(得分:1)

您可以使用XPath:

result = xml.findall(".//paste[paste_title='goodPaste']/paste_key")
print result.text

这应在您的案例中打印fsfgdsgg