Question

我正在努力从XML中提取特定数据。不幸的是，我完全没有编程经验。整整一个星期，我都试图自己解决问题，但收效甚微。

我的XML文件是自然语言处理软件的输出。

它具有以下结构：它提供了识别的信心，单词口头化的结束时间，语音转录，单词的开始时间以及之后的时间。我想提取某些单词的开始/结束时间。例如。 end =“ 3249555” start =“ 3249105” Verfahren （处理后的文本为德语）。

我知道ElemetTree是读取XML文件的软件包。我已经尝试了以下代码，但没有成功

以及XML文件的摘录

我真的很感谢任何帮助。

Answer 1

使用：

root.findAll('//*[text()="Verfahren"])

然后找到获取属性

的方法