Question

我正在VB.Net中做一个学校项目，用于从WebBrowser控件加载的网页中筛选出信息。我停留在html代码没有标识符（例如ID，ClassTags等）的某个地方。...从网页上获取信息的最佳解决方案是什么？

我已经尝试过将其移到顶级类<ul class="TopInfo">上以获取内部文本，但是它只是打印出<ul></ul>标签之间的所有内容。

<ul class="TopInfo"> <li><strong>Bargeld:</strong> 1,106,378 €</li> <li><strong>Bank:</strong> 0 €</li> </ul>

我需要获取以下值：

Bargeld: 1,106,378 € 和Bank: 0 €

Answer 1

好吧，我很幸运地工作了。

为了将来的利益，这是我使用的代码：

           For each h As HtmlElement In Form1.WebBrowser1.Document.GetElementsByTagName("ul")
            if Not Object.ReferenceEquals(h.GetAttribute("className"), Nothing) AndAlso h.GetAttribute("className").Equals("TopInfo") Then
                MsgBox(h.InnerText)
                Exit For
            End If
        Next

如何解析<li>标记中没有ID，ClassName ...的文本？

1 个答案: