使用Python从SGM文件中提取信息

时间:2013-02-28 22:45:46

标签: python parsing extraction sgml

我需要一些帮助才能使用Python从.sgm文件中提取信息。是否有适合此特定类型文件的特定库?或者用于从.xml文件中提取信息的库是否也能正常工作?如果没有可用的库,你能否建议我下载一个好的模块来处理.sgm文件?

最重要的是,如果有的话,请你解释一下.xml和.sgm文件之间的区别吗?

谢谢!

1 个答案:

答案 0 :(得分:2)

以下是一些可用于解析.sgm文件的库:

两者之间的主要区别在于SGML允许以下内容:

  

未公开的起始标签

     

未结束的结束标记

     

清空开始标记

     

清空结束标记

<强>参考