在File.ReadAllText中获取div的动态内容

时间:2014-02-17 13:06:08

标签: c# html

我需要将网页导出为PDF,以便读取该文件的所有内容并将该内容写入PDF文件。

请参阅以下div标签中的动态内容

 <div ng-app="criteriaApp">
                    <div ng-include src="'@Url.Content("~/template.html")'"></div>
            </div>

template.html内容将在jquery中动态修改并显示在视图中。

因此,当我通过开发人员工具访问网页时,我可以看到内容

<div ng-app="criteriaApp">
                        <div ng-include src="'@Url.Content("~/template.html")'">
<div>.......</div>
</div>
                </div>

但是通过 File.ReadAllText 获取内容并不会提供原始DOM元素。它仅提供页面源代码(即通过右键单击页面获取viewPage Source)

string contents = File.ReadAllText(path);

我需要通过上面的代码获取div的动态内容吗?

注意:File.ReadAllText仅返回页面源代码。并非所有DOM节点都是动态生成的。

DOM中存在动态内容。如何在C#中获取特定div的DOM代码?

我怎么能实现这个目标?

谢谢,

希瓦

1 个答案:

答案 0 :(得分:0)

要通过html代码获取div的动态内容,您需要使用像webkit这样的引擎来生成DOM。如果您需要将页面导出为pdf,则应该查看razor pdfrotativa