捕获JavaScript生成的内容

时间:2013-08-08 04:35:40

标签: javascript .net html-parsing

网页使用JavaScript将内容放在页面上,因此我得到了纯HTML,页面上没有数据。我需要一些不仅会读取HTML,还会执行JavaScript并将其应用于DOM,然后将结果作为HTML文本返回的问题。

任务与this question中的任务完全相同,但我正在寻找.NET的解决方案。

1 个答案:

答案 0 :(得分:1)

如果您发现.NET的类似内容,我会感到惊讶。我会使用PhantomJS打开页面并与DOM交互。它是一个高度可编写脚本的无头WebKit浏览器,可以轻松完成您想要的任务。有关示例,请参阅How to print html source to console with phantomjs

var page = require('webpage').create();
page.open('http://google.com', function () {
    console.log(page.content);
    phantom.exit();
});

你必须安装PhantomJS,然后启动一个单独的进程来运行你的脚本,但是PhantomJS可能会比你为.NET编写的任何东西做得好得多。