以字符串形式获取网页元素

时间:2018-08-20 12:12:32

标签: html vb.net parsing webbrowser-control

我正在尝试解析页面以查找页面上是否有我需要的字符串,因此我可以采取适当的措施。我通常会用

New System.Net.WebClient().DownloadString(URL).ToString

该实例无法使用,因为我需要登录才能查看该页面,因此,我试图在页面加载后从Web浏览器元素获取文档Text

RichTextBox2.Text = WebBrowser1.DocumentText.ToString

不幸的是,这不起作用,因为我要查找的字符串不在页面的源代码中,它似乎也没有在源代码中被引用,这确实使我感到困惑,但出现在google chrome的elements选项卡中开发人员工具。

我一直在寻找如何获取网页上所有元素的列表,以便可以仅查看其中是否包含我要查找的元素,但似乎找不到我要查找的内容。 / p>

TLDR:我正在研究如何获取已加载网页中未出现在网页源代码中的所有元素。

侧面注意:我似乎无法找到使用“ src”引用的元素,而且它似乎不在iframe中。

当我完全陷入困境时,任何帮助将不胜感激。

我环顾四周,但是如果您觉得我错过了什么,请告诉我。

1 个答案:

答案 0 :(得分:0)

对于那些感兴趣的人,我已经找到了针对我的实例的解决方法,但这将不起作用,并且只是一个小道消息,因为存在一个仅针对我要查找的条件而不是实际条件出现的不同值。

        For Each element As HtmlElement In Me.WebBrowser1.Document.All
        RichTextBox3.Text = RichTextBox3.Text + (element.TagName() & "-->" & element.Id)
    Next

这将显示我在页面上假定的某些元素,但并不是我所需要的所有元素,也不是我一直在寻找的元素,但是对于其他问题,我可能是一个不错的起点。