我的应用程序组成了一个来自多个xml源的网页模型。使用普通的Xerces解析器将这些源解析为内存为DOM对象。不幸的是,对于只读操作,Xerces DOM对象不线程安全。我希望能够重用已解析的DOM进行读取。有没有人知道我使用的另一个解析器或一个简单的线程安全的读取DOM实现?
答案 0 :(得分:4)
Saxon为其内部和不可变数据结构提供DOM包装器。
// create Saxon IdentityTransformer
final Transformer transformer = new TransformerFactoryImpl().newTransformer();
// set up holder for the output
final TinyBuilder outputTarget = new TinyBuilder(
new PipelineConfiguration(new Configuration()));
// transform into Saxon's immutable TinyTree
transformer.transform(xml, outputTarget);
// extract the whole XML as TinyNode
final TinyNodeImpl tinyNode = outputTarget.getTree().getNode(0);
// wrap TinyNode as DOM
final NodeOverNodeInfo nodeOverNodeInfo = DocumentOverNodeInfo.wrap(tinyNode);
// cast to DOM
final Document doc = (Document) nodeOverNodeInfo;
(用saxon-he 9.5.1测试)
答案 1 :(得分:0)
我不知道任何完美而简单的解决方案。
一个想法可能是使用线程安全对象重新创建Dom 。
在这种情况下,它们最好是不可变,因为您只读。 不可变也为进一步改进提供了可能性(例如,实例共享会导致更小的内存占用)。
我希望我能建议一个这样做的图书馆,因为这是一个相当数量的编码......