来自Excel工作表数据的xml文件

时间:2015-10-30 17:58:38

标签: python xml xls

您好使用下面的代码片段,我在下面创建了一个xml,但我注意到:我在代码中使用的参数顺序与输出中的参数顺序不同,即<node y="-3749099.0" x="-45194.0" id="11542.0"/>也应该是<node id="11542.0" x="-45194.0" y="-3749099.0"/>输出不是下面所需的输出。有人可以告诉我怎么做:

  • 更正我的代码以获得正确的输出
  • 扩展代码,这样如果我必须使用包含多列(超过3个)的excel文件,我就不必像val[0], val[1], val[2]
  • 那样使用硬编码FIELD(id=str(val[0]), x=str(val[1]), y=str(val[2])),

代码段:

import lxml.etree
import lxml.builder
import xlrd

wb = xlrd.open_workbook("emme_nodes1.xls")
sh = wb.sheet_by_index(0)
tags = [n.replace(" ", "").lower() for n in sh.row_values(0)]

for row in range(1, sh.nrows):
    val = sh.row_values(row)

    E = lxml.builder.ElementMaker()
    ROOT = E.network
    DOC = E.nodes
    FIELD = E.node
    my_doc = ROOT(
            DOC(
                FIELD(id=str(val[0]), x=str(val[1]), y=str(val[2])),
                )
            )
    print lxml.etree.tostring(my_doc, pretty_print=True)

输出:                                 

<network>
  <nodes>
    <node y="-3748681.0" x="-45333.0" id="11543.0"/>
  </nodes>
</network>

<network>
  <nodes>
    <node y="-3747847.0" x="-44369.0" id="11540.0"/>
  </nodes>
</network>

<network>
  <nodes>
    <node y="-3748683.0" x="-45060.0" id="11541.0"/>
  </nodes>
</network>

<network>
  <nodes>
    <node y="-3750248.0" x="-45518.0" id="11546.0"/>
  </nodes>
</network>

<network>
  <nodes>
    <node y="-3750024.0" x="-45448.0" id="11547.0"/>
  </nodes>
</network>

<network>
  <nodes>
    <node y="-3749821.0" x="-44745.0" id="11544.0"/>
  </nodes>
</network>

<network>
  <nodes>
    <node y="-3750508.0" x="-45561.0" id="11545.0"/>
  </nodes>
</network>

<network>
  <nodes>
    <node y="-3750202.0" x="-45802.0" id="11548.0"/>
  </nodes>
</network>

<network>
  <nodes>
    <node y="-3749805.0" x="-45485.0" id="11549.0"/>
  </nodes>
</network>

期望的输出:

<network>
  <nodes>
    <node id="11542.0" x="-45194.0" y="-3749099.0"/>
    <node id="11543.0" x="-45333.0" y="-3748681.0"/>
    <node id="11540.0" x="-44369.0" y="-3747847.0"/>
    <node id="11541.0" x="-45060.0" y="-3748683.0"/>
    <node id="11546.0" x="-45518.0" y="-3750248.0"/>
    <node id="11547.0" x="-45448.0" y="-3750024.0"/>
    <node id="11544.0" x="-44745.0" y="-3749821.0"/>
    <node id="11545.0" x="-45561.0" y="-3750508.0"/>
    <node id="11549.0" x="-45485.0" y="-3749805.0"/>
    <node id="11548.0" x="-45802.0" y="-3750202.0"/>
    <node id="11549.0" x="-45485.0" y="-3749805.0"/>
  </nodes>
</network>

Excel表格(emme_nodes1.xls):

 id         x           y
11542   -45194.0    -3749099.0
11543   -45333.0    -3748681.0
11540   -44369.0    -3747847.0
11541   -45060.0    -3748683.0
11546   -45518.0    -3750248.0
11547   -45448.0    -3750024.0
11544   -44745.0    -3749821.0
11545   -45561.0    -3750508.0
11548   -45802.0    -3750202.0
11549   -45485.0    -3749805.0

2 个答案:

答案 0 :(得分:1)

跟踪代码的执行情况。

你拥有的是:

  1. 第一行:

    1. 创建新的XML文档构建器
    2. 创建新的根元素
    3. 创建一个新的网络&#39;元件
    4. 将其添加到根节点
    5. 打印整个文档
  2. 第二行:

    1. 创建新的XML文档构建器
    2. 创建新的根元素
    3. 创建一个新的网络&#39;元件
    4. 将其添加到根节点
    5. 打印整个文档
  3. 第三排:  重复

  4. 你想要做的是:

    1. 创建新的XML文档构建器
    2. 创建新的根元素
    3. 第一行:
      1. 创建一个新的网络&#39;元件
      2. 将其添加到根节点
    4. 第二行:
      1. 创建一个新的网络&#39;元件
      2. 将其添加到根节点
    5. ...
    6. 打印整个文档
    7. 看看您是否可以相应地更改代码并更新它。

答案 1 :(得分:1)

我终于找到了这个解决方案,而且效果很好

import xlrd
from lxml import etree

root = etree.Element('network')
root.set('name', 'Network')
tree = etree.ElementTree(root)
name = etree.Element('nodes')
root.append(name)   
wb = xlrd.open_workbook("emme_nodes1.xls")
sh = wb.sheet_by_index(0)

for row in range(1, sh.nrows):
    val = sh.row_values(row)
    element = etree.SubElement(name, 'node')
    element.set('id', str(int(val[0])))
    element.set('x', str(val[1]))
    element.set('y', str(val[2]))
print etree.tostring(root,pretty_print=True)