使用PyXB,我希望序列化一个子节点,然后能够将其解析回来。天真的方式是行不通的,因为根据模式,子节点不是有效的根元素。
我的架构:
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="root" type="Root"/>
<xsd:complexType name="Root">
<xsd:sequence>
<xsd:element name="item" maxOccurs="unbounded" type="Item"/>
</xsd:sequence>
</xsd:complexType>
<xsd:complexType name="Item">
<xsd:sequence>
<xsd:element name="val"/>
</xsd:sequence>
</xsd:complexType>
</xsd:schema>
示例XML:
<?xml version="1.0" encoding="utf-8"?>
<root>
<item>
<val>1</val>
</item>
<item>
<val>2</val>
</item>
<item>
<val>3</val>
</item>
</root>
我需要能够序列化特定项目然后加载回来。像这样:
>>> root = CreateFromDocument(sample)
# locate a sub node to serialize
>>> root.item[1].toxml()
'<?xml version="1.0" ?><item><val>2</val></item>'
# load the sub node, getting an Item back
>>> sub_node = CreateFromDocument('<?xml version="1.0" ?><item><val>2</val></item>')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "binding.py", line 63, in CreateFromDocument
instance = handler.rootObject()
File "pyxb/binding/saxer.py", line 285, in rootObject
raise pyxb.UnrecognizedDOMRootNodeError(self.__rootObject)
pyxb.exceptions_.UnrecognizedDOMRootNodeError: <pyxb.utils.saxdom.Element object at 0x7f30ba4ac550>
# or, perhaps, some kind of unique identifier:
>>> root.item[1].hypothetical_unique_identifier()
'//root/item/1'
>>> sub_node = CreateFromDocument(sample).find_node('//root/item/1')
<binding.Item object at 0x7f30ba4a5d50>
这当然不起作用,因为item
根据架构不能成为根节点。有没有办法解析一个子树,反而得到一个Item?
或者,有没有办法唯一地识别一个子节点,以便我以后可以找到它?
答案 0 :(得分:0)
PyXB无法解析以非全局元素开头的文档,因为非全局元素的验证自动机状态不是开始状态。
虽然我原本想要支持像XPath这样的东西,但它从未实现过,也没有标准的唯一标识符来承载结构信息。如果你需要标记一个成员元素,以便你可以删除它,然后将它放回原来的位置,你可以只为对象分配其他属性并在应用程序级别使用它们; e.g:
e = root.item[1]
e.__mytag = '//root/item/1'
然后,您可以编写一个遍历对象树搜索匹配项的函数。当然,这样的属性只与该实例保持关联,因此随后将另一个对象分配给root.item[1]
将不会自动继承相同的属性。
答案 1 :(得分:0)
我最终这样做的方法是使用元素的起始行和列号来识别它。
我将这个mixin添加到我的所有元素中:
let
然后使用此函数稍后查找节点:
class IdentifierMixin(object):
"""
Adds an identifier property unique to this node that can be used to locate
it in the document later.
"""
@property
def identifier(self):
return '%s-%s' % (self._location().lineNumber, self._location().columnNumber)