我是python的新手,我正在尝试解析一个xml文档以计算总数。言语,我尝试了下面的程序来计算n不。文件中的单词,但我得到如下错误:
收到此错误后,我安装了" utils"但仍然来了。 有没有其他简单的方法来获得totla no。 python中的xml文档的单词,请帮助!
Traceback (most recent call last):
File "C:\Python27\xmlp.py", line 1, in <module>
from xml.dom import utils,core
ImportError: cannot import name utils
编码
from xml.dom import utils,core
import string
reader = utils.FileReader('Greeting.xml')
doc = reader.document
Storage = ""
for n in doc.documentElement.childNodes:
if n.nodeType == core.TEXT_NODE:
# Accumulate contents of text nodes
Storage = Storage + n.nodeValue
print len(string.split(Storage))
答案 0 :(得分:2)
您会发现使用ElementTree
更容易,例如:
from xml.etree import ElementTree as ET
xml = '<a>one two three<b>four five<c>Six Seven</c></b></a>'
tree = ET.fromstring(xml)
total = sum(len(text.split()) for text in tree.itertext())
# 7
但请使用tree = ET.parse('Greeting.xml')
加载您的实际数据。
答案 1 :(得分:0)
from xml.dom import minidom
在这里看一个类似的例子:Python XML File Open