使用“TheName”使用lxml </field>访问指定为<field name =“TheName”>的字段

时间:2014-06-16 09:16:09

标签: python xml lxml

是否可以使用&#34; TheName&#34;访问以下示例数据中的数据。指定? 我对lxml和xml一般都比较新,这种类型的字段让我觉得不寻常。 可悲的是,这是我必须要处理的输出。

请注意,每个字段的子项数都会发生变化,因此请使用&#34; Name1&#34;字段不起作用。

示例XML:

<main>
      <header>
        <row type="info">
          <field name="description"><![CDATA[Results]]></field>
          <field name="created"><![CDATA[6/12/2014 6:45:00 PM]]></field>
        </row>
        <row>
          <field name="profile"><![CDATA[Intel]]></field>
        </row>
      </header>
      <sections>
        <section name="Results">
          <description />
          <parameters />
          <header />
          <content>
            <row>
              # A row-dependend number of fields exist before the Full Content field
              <field name="Name1"><![CDATA[ I am the text of interest]]></field>
              <field name="AnotherName"><![CDATA[ There is content in this field, too]]></field>
              # A row-dependend number of fields follow here
            </row>
            # There are 40,000 of these row elements
          </content>
          <footer>
            <row type="content_count">
              <field name="count"><![CDATA[9981]]></field>
            </row>
          </footer>
        </section>
      </sections>
    </main>

那么,如何可靠地了解这些领域的内容呢?

谢谢你的考虑, 的Matthias

1 个答案:

答案 0 :(得分:0)

如果您想访问field所在的name="TheName"标记,请使用以下XPath:/main/sections/section/content/row/field[@name='TheName']

有关详细信息,请参阅http://www.w3schools.com/xpath/xpath_syntax.asp