我正在努力从XML中提取特定数据。不幸的是,我完全没有编程经验。整整一个星期,我都试图自己解决问题,但收效甚微。
我的XML文件是自然语言处理软件的输出。
它具有以下结构:它提供了识别的信心,单词口头化的结束时间,语音转录,单词的开始时间以及之后的时间。我想提取某些单词的开始/结束时间。例如。 end =“ 3249555” start =“ 3249105” Verfahren (处理后的文本为德语)。
我知道ElemetTree是读取XML文件的软件包。 我已经尝试了以下代码,但没有成功
以及XML文件的摘录
我真的很感谢任何帮助。
答案 0 :(得分:0)
使用:
root.findAll('//*[text()="Verfahren"])
然后找到获取属性
的方法