用于解析XML和HTML文档的兼容层?

时间:2011-03-29 20:37:42

标签: java parsing xslt transformation

我正在为Java中的餐馆菜单制作聚合器。我正在寻找以各种方式提取格式化文档内容的最佳方法:一些餐馆提供RSS提要,其他餐馆提供HTML表格,对于其他人,您必须编译显示在多个页面上的结果......

我正在寻找的是一种描述从源文档转换为易于解析的格式所必需的转换的方法。当然,这种转换必须是不同的,并为每个数据源定制,但这不是问题。

我知道我可以为每家餐厅编写一个Java适配器,但我正在寻找一种更简单,更标准的解决方案。基本上类似于XSLT,但更灵活。

有什么想法吗?谢谢你的帮助。

1 个答案:

答案 0 :(得分:1)

XSLT 2.0(简单,标准且比XSLT 1.0更灵活)