根据Validating a HUGE XML file 同意,但我仍然感到困惑......如何使用SAX解析进行XML模式验证。我的意思是模式验证涉及在XML中来回传递以验证例如 - 关键引用等。不应该在整个XML中提供记忆要做到这一点? 抱歉这个愚蠢的问题:(
答案 0 :(得分:4)
对模式的验证可以使用几乎为零的内存来完成。 UPA约束确保针对内容模型的验证永远不需要回溯。当然,您需要跟踪堆栈中每个元素的内容模型的FSM中的状态,即与文档的最大嵌套深度成比例的内存。
ID / IDREF验证是一个例外:为此,处理器需要的内存与遇到的ID和IDREF值的数量成比例。粗略地说,处理器会记住找到的所有ID和IDREF值,当它到达文档末尾时,检查没有ID出现两次,并且每个IDREF都出现在ID中。类似地,为了检查unique / key / keyref,处理器需要记住找到了哪些键值。但是,这需要的内存远远少于“将整个XML保留在内存中”。
答案 1 :(得分:0)
大多数解析器必须在开始任何验证之前在内存中构建一个Schema / DTD树,之后它主要是顺序查找,有时候是一点推,查看和弹出。