Question

我尝试使用python解析Wildfly 8.1 Final中的standalone-full.xml，以提取一些信息作为数据源。

下面的示例XML。

<?xml version="1.0" ?>
<server xmlns="urn:jboss:domain:2.1">
<profile>
       <subsystem xmlns="urn:jboss:domain:datasources:2.0">
        <datasources>
            <datasource jndi-name="java:jboss/datasources/JNDI" pool-name="JNDI" enabled="true">
                <connection-url>jdbc:oracle:thin:@//HOST</connection-url>
                <driver>ojdbc6</driver>
                <pool>
                    <min-pool-size>50</min-pool-size>
                    <max-pool-size>100</max-pool-size>
                </pool>
                <security>
                    <user-name>USER</user-name>
                    <password>USER</password>
                </security>
                <validation>
                    <valid-connection-checker class-name="org.jboss.jca.adapters.jdbc.extensions.oracle.OracleValidConnectionChecker"/>
                    <validate-on-match>false</validate-on-match>
                    <background-validation>true</background-validation>
                    <background-validation-millis>10000</background-validation-millis>
                    <exception-sorter class-name="org.jboss.resource.adapter.jdbc.vendor.OracleExceptionSorter"/>
                </validation>
            </datasource>
            <drivers>
                <driver name="h2" module="com.h2database.h2">
                    <xa-datasource-class>org.h2.jdbcx.JdbcDataSource</xa-datasource-class>
                </driver>
                <driver name="ojdbc6" module="oracle.ojdbc">
                    <xa-datasource-class>oracle.ojdbc.xa.client.OracleXADataSource</xa-datasource-class>
                </driver>
            </drivers>
        </datasources>
    </subsystem>
 </profile>

编辑：我怎样才能更深入树？

我试过这样的事情：

In[16]: from lxml import etree
In[18]: xml = etree.parse('standalone-full.xml')
In[21]: root = xml.getroot()
In[28]: children = root[0].getchildren()
In[31]: children[0]
Out[31]: <Element {urn:jboss:domain:datasources:2.0}subsystem at 0x4bef208>
In[32]: datasources = children[0]
In[33]: datasources.getchildren()
Out[33]: [<Element {urn:jboss:domain:datasources:2.0}datasources at 0x4befa48>]

Answer 1

您的问题相当不明确，但据我发布的正则表达式所示，您希望获取connection-url，user-name和password节点的文本值在每个datasource节点下，其pool-name属性的值为JNDI。这是一种可能性（在Python 2.7下测试）：

import xml.etree.cElementTree as ET

ns = {'ds': 'urn:jboss:domain:datasources:2.0'}
root = ET.parse('standalone-full.xml').getroot()
children = root.findall(".//ds:datasource[@pool-name='JNDI']", ns)

for child in children:
    print child.find("ds:connection-url", ns).text
    security = child.find("ds:security", ns)
    print security.find("ds:user-name", ns).text
    print security.find("ds:password", ns).text

Answer 2

我用正则表达式解决了我的问题，这是一个坏主意，但它确实有效。

import re
data = "standalone-full.xml"
regex_result = re.findall(r'.*:domain:datasources[\S\s]*?pool-name="JNDI"[\S\s]*?connection-url>.*' +
                                      '@//(.*)<.*[\S\s]*?user-name>(.*)<.*\s*<password>(.*)<', data, re.M)

Answer 3

您可以使用Augeas来解析它：

$ augtool -At "Xml.lns incl $PWD/standalone-full.xml"
augtool> get //standalone-full.xml//datasource//password/#text
//standalone-full.xml//datasource//password/#text = USER

只需使用python-augeas绑定Python：

import augeas
a = augeas.Augeas(flags=augeas.Augeas.NO_MODL_AUTOLOAD)
a.transform("Xml", "/home/raphink/bas/augeas/standalone-full.xml")
a.load()
v = a.get("//standalone-full.xml//datasource//password/#text")

Python解析Wildfly的standalone-full.xml

3 个答案: