执行脚本后从Java中提取HTML

时间:2011-10-14 08:47:12

标签: java html

我有一个HTML文件,其中包含UI defenition和带有一些数据的XML文件,这些文件将使用脚本解析在此UI中呈现。这是通过浏览器实现的,它完美呈现。现在我的问题是关于在没有浏览器的情况下进行渲染的任何方法,并提取生成的HTML,并将所有数据值放在位置中,以便我可以单独创建一个HTML文件,这是创建PDF所需的。

我可以从Java完成这项任务吗?有没有可用的选择?

编辑:

我从Sourceforge找到了一个名为HtmlUnit的模拟库。这样可以正确呈现HTML,并且正在执行少量脚本。问题是他们的JavaScript引擎不支持DOMParser或任何XML解析方法。任何人都知道这个解决方案吗?

2 个答案:

答案 0 :(得分:0)

你看过XSLT这样做了吗?

答案 1 :(得分:0)

使用使用Flying SauceriText underneath,您可以将带有css的html转换为PDF格式。

我不明白的是HTML和XML如何在浏览器中显示。有没有很多javascript将xml分开并注入HTML?是否有一些库正在进行模板处理?

-edit -

我担心您使用javascript来填充页面。 我只是提出建议,因为我真的不确定如何处理。

Cobra看起来它是一个可以处理html和javascript的库。它似乎现在只支持html4,我不知道你是否可以提供所有的输入并让它产生一个输出流,然后你可以提供给Flying Saucer。

您可能需要退后一步并创建一个特定页面,该页面由xml数据填充以用于此目的。