如何解析包含javascript的渲染网页

时间:2009-11-19 18:38:04

标签: html-parsing userscripts information-extraction

如何从渲染的网页中提取数据? 其中java脚本会随着时间更新数据。 是否可以编写可以从网页java脚本访问变量的用户脚本? 请提出可行的方法来实现这一目标。

2 个答案:

答案 0 :(得分:2)

根据Turing's Halting Problem Theorem,你不能。

当我们说JavaScript是Turing complete语言时,这就是我们的意思。唯一的方法是执行JavaScript并让它呈现页面。

答案 1 :(得分:2)

这取决于您的编程语言。

在C#中,您可以使用webbrowser control,然后使用Webbrowser.Document属性获取HTMLDocument对象以获取当前标记。 要在文档中调用javascript函数,请使用Browser控件的ObjectForScripting属性。