在c#windows应用程序中删除整个页面源

时间:2012-02-12 14:43:55

标签: c# web-scraping

我正在尝试诈骗页面源但我发现响应整页源不会意味着一些div值不会出现虽然它存在于页面查看源中但不会进入c#响应。

请指导我如何在c#windows应用程序中获取丢失的潜水值。

2 个答案:

答案 0 :(得分:0)

您在响应中缺少的元素可能是使用JavaScript动态添加的元素。

假设您正在使用HttpWebRequest加载页面,在执行此类请求时,JavaScript将无法在您正在抓取的URL上执行。

使用WinForms,您可以使用WebBrowser控件来加载网页,然后在加载完成时,您可以获得页面的来源。我相信会在页面上执行JavaScript。

答案 1 :(得分:0)

您可以使用以下语法,其中panel-header是HTML的ClassName,我们用它来标识我们的html部分。

var panelHeader = driver.FindElement(OpenQA.Selenium.By.ClassName("panel-header")).Text;

如果您没有类名,或者您想使用Id,则必须选择

  

By.Id( “破折号= 1234”)   这将获取给定类或id的所有文本。