Python,从XML中提取日期

时间:2014-11-26 11:41:13

标签: python xml date extraction

道歉,我的Python知识非常不存在。我需要从某些XML中提取日期,格式类似于:

<Header>
<Version>1.0</Version>
....
    <cd:Data>...</Data>
    .....
    <cd:DateReceived>20070620171524</cd:DateReceived>

从这里环顾四周,我发现了类似的东西

#!/usr/bin/python
from xml.dom.minidom import parse  
import xml.dom.minidom

# Open XML document using minidom parser
DOMTree = xml.dom.minidom.parse("date.xml")
collection = DOMTree.documentElement

print collection.getElementsByTagName("cd:DateReceived").item(0)

但是这只打印十六进制值:

<DOM Element: cd:DateReceived at 0x1529e0>

如何获取日期20070620171524?

我已尝试使用以下

#!/usr/bin/python
from xml.dom.minidom import parse  
import xml.dom.minidom

# Open XML document using minidom parser
DOMTree = xml.dom.minidom.parse("date.xml")
collection = DOMTree.documentElement

date = cd:DateReceived[0].firstChild.nodeValue
print date

但它会出错,因为它不喜欢&#34; cd&#34;标签的一部分

date = cd:DateReceived[0].firstChild.nodeValue
         ^
SyntaxError: invalid syntax

任何帮助将不胜感激。谢谢!

1 个答案:

答案 0 :(得分:1)

collection.getElementsByTagName("cd:DateReceived").item(0)返回一个节点。从该节点,您可以获得nodeValue