如何从dtd文件中提取特定信息?

时间:2012-03-08 10:36:43

标签: python dtd

在python中,我想从dtd文件中定义的元素中获取所需属性的列表? 有没有可能做到这一点?

<!ELEMENT Book EMPTY>
<!ATTLIST Book
isbn CDATA #REQUIRED
title CDATA #REQUIRED
author CDATA #REQUIRED
release CDATA #IMPLIED
>

我想获得此元素的所有必需属性。 “isbn”,“title”和“author”。

我的python数组应如下所示:

bookRequiredAtts = {"isbn","title","author"}
bookOptionalAtts = {"release"}

1 个答案:

答案 0 :(得分:-1)

beautifulsoup解析它。然后,您可以find获得所需的属性。

以下是一些可以帮助您的代码:

from BeautifulSoup import BeautifulStoneSoup
xml = "<!ELEMENT Book EMPTY>
<!ATTLIST Book
isbn CDATA #REQUIRED
title CDATA #REQUIRED
author CDATA #REQUIRED
release CDATA #IMPLIED
>
"
soup = BeautifulStoneSoup(xml)
soup.findAll(isbn=True,title=True)

有关任何其他帮助,请参阅documentation