使用Python从XML提取数据

时间:2018-10-26 15:19:53

标签: python xml

我正在努力从XML中提取特定数据。不幸的是,我完全没有编程经验。整整一个星期,我都试图自己解决问题,但收效甚微。

我的XML文件是自然语言处理软件的输出。

它具有以下结构:它提供了识别的信心,单词口头化的结束时间,语音转录,单词的开始时间以及之后的时间。我想提取某些单词的开始/结束时间。例如。 end =“ 3249555” start =“ 3249105” Verfahren (处理后的文本为德语)。

我知道ElemetTree是读取XML文件的软件包。 我已经尝试了以下代码,但没有成功

enter image description here

以及XML文件的摘录

enter image description here

我真的很感谢任何帮助。

1 个答案:

答案 0 :(得分:0)

使用:

root.findAll('//*[text()="Verfahren"])

然后找到获取属性

的方法