没有href的GetElementsByTagName

时间:2015-08-27 08:08:02

标签: javascript jquery html css vb.net

我正在从VB.net WinForm中读取网页HTML文档中所有元素<a>的类:

  Dim htmlLinks As HtmlElementCollection = WebBrowser1.Document.GetElementsByTagName("a")
  For Each link As HtmlElement In htmlLinks
    Console.WriteLine(link.GetAttribute("classname").ToString)
  Next

以下是HTML文档中的一个小例子:

<a href=​"/​test.php" class=​"nav">Item1</a> 
<a class=​"link-download" href=​"http:​/​/​test.net/​media/​26.mp4">​​MP4 File</a>​

我上面写的VB代码只读Class属性a,其中href元素首先出现,

<a href=​"/​test.php" class=​"nav">Item1</a> 

并且遗漏了class

之前href属性的第二个
 <a class=​"link-download" href=​"http:​/​/​test.net/​media/​26.mp4">​​MP4 File</a>​

表示我的VB代码只返回类名nav

这有意义吗?

我需要阅读上面的所有<a>元素

我该怎么做?

1 个答案:

答案 0 :(得分:2)

我用您发布的html文本制作了测试html页面。 VB代码对我来说没问题。我在集合中得到两个元素。但是,它们中有一些垃圾字符。我只是启用了隐藏的字符来验证,我确实看到了垃圾字符。删除这些字符可以修复所有问题。

junk characters in html text