feedparser无法获取命名空间值

时间:2014-08-11 15:36:22

标签: python xml feedparser

嗨我想找到从feedparser返回的字符串中提取值的最佳方法,基本上它返回以下内容,我当然可以进行正则表达式匹配,但我确定有更好的方法。

xml如下所示: -

<description>
   Size: 2247 MB People: 5,951 Hash: 9df49c5de014df3b5f202f51dc849b37cf82a3ad
</description>
来自feedparser的结果如下: -

 Size: 2247 MB People: 5,951 Hash: 9df49c5de014df3b5f202f51dc849b37cf82a3ad

基本上我想要Size,People和Hash值,例如。

2247
5,951
9df49c5de014df3b5f202f51dc849b37cf82a3ad

我已经尽可能多地阅读了关于这样做的内容,并且我对我的女性学不是100%肯定,但我认为这与命名空间有关。

1 个答案:

答案 0 :(得分:0)

import re

s = "Size: 2247 MB People: 5,951 Hash: 9df49c5de014df3b5f202f51dc849b37cf82a3ad"
arr = re.split('Size: |People: |Hash: ', s)
arr = [x.strip() for x in arr][1:]
print arr

输出['2247 MB', '5,951', '9df49c5de014df3b5f202f51dc849b37cf82a3ad']