为所有XML属性添加偏移量

时间:2018-12-09 13:15:22

标签: python xml elementtree

我有一个XML文件

<?xml version="1.0" encoding="ISO-8859-1" standalone="yes"?>
<PageDescription>
    <Page>
        <Row />
        <Row>
            <Cell cellRow="0" cellColumn="0" Pos="693" />           
            <Cell cellRow="0" cellColumn="1" Pos="2693" />
        </Row>
    </Page>
</PageDescription>  

,其中包含不同的 结构和属性。 现在我想更改例如的值 通过添加一定的偏移量来赋予Pos属性, 在这种情况下12。但是我遇到了错误。

for currfile in allfiles:

    filepathstr = xmldir + "/" + currfile;    
    tree = xee.ElementTree(file=filepathstr)

    for tag in tree.findall('Page'):
        for tag2 in tag.findall('Row'):
            for tag3 in tag2.findall('Cell'):                              

                selectTag = tag3.attrib['Pos']
                newVal = int(selectTag)+12
                tag3.set('Pos', newVal)

expfilename = expdir + "/" + currfile

tree.write(expfilename,encoding="ISO-8859-1")

我收到以下错误

     <class 'xml.etree.ElementTree.ElementTree'>
    ---------------------------------------------------------------------------
    TypeError                                 
    Traceback (most recent call last)

C:\ProgramData\Anaconda3\lib\xml\etree\ElementTree.py in _escape_attrib(text)
   1079     try:
-> 1080         if "&" in text:
   1081             text = text.replace("&", "&amp;")

TypeError: argument of type 'int' is not iterable

During handling of the above exception, another exception occurred:

TypeError                                 Traceback (most recent call last)
<ipython-input-2-b1ffea99d1f3> in <module>()
 67     expfilename = expdir + "/" + currfile
 68 
---> 69     tree.write(expfilename,encoding="ISO-8859-1")

有人看到错误吗?还是使用XPath更容易完成这些任务?

1 个答案:

答案 0 :(得分:0)

在ElementTree中,属性值必须是显式的字符串,没有自动类型转换。

如果要存储其他内容,例如int,则必须进行转换以自己进行字符串化。毕竟,当您读取属性值时,您会得到一个字符串,并且自己也进行了向int的转换。

使用XPath将消除对嵌套循环的需求。

for currfile in allfiles:
    tree = xee.ElementTree(os.path.join(xmldir, currfile))

    for cell in tree.findall('./Page/Row/Cell'):
        pos = int(cell.get('Pos'))
        cell.set('Pos', str(pos + 12))

    tree.write(os.path.join(expdir, currfile))

此外,除非有充分的理由,否则不要将XML文件存储在ISO-8859-1之类的旧式编码中。使用Unicode编码,例如UTF-8。