道歉,我的Python知识非常不存在。我需要从某些XML中提取日期,格式类似于:
<Header>
<Version>1.0</Version>
....
<cd:Data>...</Data>
.....
<cd:DateReceived>20070620171524</cd:DateReceived>
从这里环顾四周,我发现了类似的东西
#!/usr/bin/python
from xml.dom.minidom import parse
import xml.dom.minidom
# Open XML document using minidom parser
DOMTree = xml.dom.minidom.parse("date.xml")
collection = DOMTree.documentElement
print collection.getElementsByTagName("cd:DateReceived").item(0)
但是这只打印十六进制值:
<DOM Element: cd:DateReceived at 0x1529e0>
如何获取日期20070620171524?
我已尝试使用以下
#!/usr/bin/python
from xml.dom.minidom import parse
import xml.dom.minidom
# Open XML document using minidom parser
DOMTree = xml.dom.minidom.parse("date.xml")
collection = DOMTree.documentElement
date = cd:DateReceived[0].firstChild.nodeValue
print date
但它会出错,因为它不喜欢&#34; cd&#34;标签的一部分
date = cd:DateReceived[0].firstChild.nodeValue
^
SyntaxError: invalid syntax
任何帮助将不胜感激。谢谢!
答案 0 :(得分:1)
collection.getElementsByTagName("cd:DateReceived").item(0)
返回一个节点。从该节点,您可以获得nodeValue