我的工作是解析XML文件并检索各种报告。我还使用Python中的etree创建和编辑XML文件。大多数时候,我被困在包含mdash,nbsp等自定义实体的文件中。
我浏览了这里提到的一个解决方案Python ElementTree support for parsing unknown XML entities?
所以我添加了实体定义[!ENTITY nbsp“ ]并对其进行了处理。它工作但我需要将它们作为字符串读取,将实体定义添加到其中,然后继续我的工作。
这是唯一的方法吗?如果我想用自定义实体解析XML文件而不将它们添加到文件中,我可以这样做吗?
有没有办法在脚本中定义这些实体并解析XMl文件?