解析依赖项Pom文件

时间:2020-07-18 06:24:56

标签: python arrays dictionary parsing pom.xml

我正在尝试解析pom文件,但遇到一个我无法解决的问题。我当前的代码成功地从pom文件读取,解析和输出。问题出在依赖项未按相同顺序指定artifactId,groupId,版本。

我应该在for循环中放置什么条件,以便它忽略标签(例如 type ),而仅检索artifactId,groupId和版本?

代码:

for dep in depend:
    infoList = []
    counter += 1
    for child in dep.getchildren():
        infoList.append(child.tag.split('}')[1])
        infoList.append(child.text)

    #list where data is being stored
    dependencyInfo[infoList[1]].update({infoList[2] : infoList[3],infoList[4] : infoList[5]})

Pom文件示例

<dependency>
    <artifactId>slf4j-api</artifactId>
    <groupId>org.slf4j</groupId>
    <type>jar</type>
    <version>1.6.1</version>
</dependency>
<dependency>
    <groupId>org.slf4j</groupId>
    <artifactId>log4j-over-slf4j</artifactId>
    <version>1.6.1</version>
</dependency>
<dependency>
    <groupId>sample.ProjectA</groupId>
    <artifactId>Project-A</artifactId>
    <scope>compile</scope>
    <version>1.0</version>
    <optional>true</optional>
</dependency>

实际输出:

defaultdict(<class 'dict'>,{'slf4j-api': {'groupId': 'org.slf4j', 'type': 'jar'}, 'org.slf4j': {'artifactId': 'log4j-over-slf4j', 'version': '1.6.1'}, 'sample.ProjectA': {'artifactId': 'Project-A', 'scope': 'compile'}})

预期输出:

defaultdict(<class 'dict'>,{'slf4j-api': {'groupId': 'org.slf4j', 'version': '1.6.1'}, 'org.slf4j': {'artifactId': 'log4j-over-slf4j', 'version': '1.6.1'}, 'sample.ProjectA': {'artifactId': 'Project-A', 'version': '1.0'}})

任何帮助将不胜感激

1 个答案:

答案 0 :(得分:0)

由于文件示例看起来像XML,因此建议您使用XML parser而不是自己动手制作。

有一些学习曲线可以获取所需的确切数据,但是值得学习,因为它可以扩展以解析更多高级和复杂类型,并且不会出现逻辑错误。

相关问题