用python无法读取这个xml?

时间:2012-07-20 03:15:18

标签: python xhtml

我对xhtml几乎一无所知。我必须编写一个python脚本来编辑表。但是我必须编辑的wiki页面由于某种原因不被任何python xml解析器读取,我不知道发生了什么。这是wiki的示例页面。谁能告诉我这有什么问题?

<h2>test</h2><p>&nbsp;</p><p><strong>I am a test</strong></p><p>&nbsp;</p><p>Now I need a table</p><table>
<tbody>
<tr>
    <th>name</th>
    <th>column</th>
</tr>
<tr>
    <td>data1</td>
    <td><p>data2</p></td>
</tr>
</tbody>
</table><p>&nbsp;</p><p>&nbsp;</p>

以下是我一直试图阅读的一些代码。我经历了几次迭代和不同的xml解析器,pulldom,xml.dom,ElementTree,minidom等。他们都给出了相同的例外:

from xml.etree import ElementTree as ET
def main( argv ):
    fileName = "/home/robbnic/Source/scripts/Gesture Service Dashboard.txt"
    text = readFromFile(fileName)
    try:
        for event, elem in ET.iterparse(fileName):
            if elem.tag == "table":
                print "Hot damn!"
                elem.clear()
    except ET.ParseError as pe:
         print pe.message
         print pe.msg
         print pe.args
         print pe.filename
    except:
         print "Unexpected error:", sys.exc_info()[0]
         raise

我一直得到的异常错误是未绑定的前缀,但我对xml(或本例中的xhtml)知之甚少,我只是不知道发生了什么。

1 个答案:

答案 0 :(得分:2)

您缺少一个根标记。你不能拥有多个根(即h2ptable等。)