我正在尝试解析pom文件,但遇到一个我无法解决的问题。我当前的代码成功地从pom文件读取,解析和输出。问题出在依赖项未按相同顺序指定artifactId,groupId,版本。
我应该在for循环中放置什么条件,以便它忽略标签(例如 type ),而仅检索artifactId,groupId和版本?
代码:
for dep in depend:
infoList = []
counter += 1
for child in dep.getchildren():
infoList.append(child.tag.split('}')[1])
infoList.append(child.text)
#list where data is being stored
dependencyInfo[infoList[1]].update({infoList[2] : infoList[3],infoList[4] : infoList[5]})
Pom文件示例
<dependency>
<artifactId>slf4j-api</artifactId>
<groupId>org.slf4j</groupId>
<type>jar</type>
<version>1.6.1</version>
</dependency>
<dependency>
<groupId>org.slf4j</groupId>
<artifactId>log4j-over-slf4j</artifactId>
<version>1.6.1</version>
</dependency>
<dependency>
<groupId>sample.ProjectA</groupId>
<artifactId>Project-A</artifactId>
<scope>compile</scope>
<version>1.0</version>
<optional>true</optional>
</dependency>
实际输出:
defaultdict(<class 'dict'>,{'slf4j-api': {'groupId': 'org.slf4j', 'type': 'jar'}, 'org.slf4j': {'artifactId': 'log4j-over-slf4j', 'version': '1.6.1'}, 'sample.ProjectA': {'artifactId': 'Project-A', 'scope': 'compile'}})
预期输出:
defaultdict(<class 'dict'>,{'slf4j-api': {'groupId': 'org.slf4j', 'version': '1.6.1'}, 'org.slf4j': {'artifactId': 'log4j-over-slf4j', 'version': '1.6.1'}, 'sample.ProjectA': {'artifactId': 'Project-A', 'version': '1.0'}})
任何帮助将不胜感激
答案 0 :(得分:0)
由于文件示例看起来像XML,因此建议您使用XML parser而不是自己动手制作。
有一些学习曲线可以获取所需的确切数据,但是值得学习,因为它可以扩展以解析更多高级和复杂类型,并且不会出现逻辑错误。