如何解析<li>标记中没有ID,ClassName ...的文本?

时间:2019-01-07 19:58:09

标签: wpf vb.net parsing dom webbrowser-control

我正在VB.Net中做一个学校项目,用于从WebBrowser控件加载的网页中筛选出信息。我停留在html代码没有标识符(例如ID,ClassTags等)的某个地方。...从网页上获取信息的最佳解决方案是什么?

我已经尝试过将其移到顶级类<ul class="TopInfo">上以获取内部文本,但是它只是打印出<ul></ul>标签之间的所有内容。

<ul class="TopInfo"> <li><strong>Bargeld:</strong> 1,106,378 €</li> <li><strong>Bank:</strong> 0 €</li> </ul>

我需要获取以下值:

Bargeld: 1,106,378 €Bank: 0 €

1 个答案:

答案 0 :(得分:0)

好吧,我很幸运地工作了。

为了将来的利益,这是我使用的代码:

           For each h As HtmlElement In Form1.WebBrowser1.Document.GetElementsByTagName("ul")
            if Not Object.ReferenceEquals(h.GetAttribute("className"), Nothing) AndAlso h.GetAttribute("className").Equals("TopInfo") Then
                MsgBox(h.InnerText)
                Exit For
            End If
        Next