我正在使用正则表达式从网站获取一些信息,我有这个代码:
Dim request As System.Net.HttpWebRequest = System.Net.HttpWebRequest.Create("http://www.startkabel.nl/zoeken/index.php?zoek=" & TextBox1.Text)
Dim response As System.Net.HttpWebResponse = request.GetResponse
Dim sr As System.IO.StreamReader = New System.IO.StreamReader(response.GetResponseStream())
Dim startpagina As String = sr.ReadToEnd
Dim sp As New System.Text.RegularExpressions.Regex("<a href=http://games.startkabel.nl>games.startkabel.nl</a></td>")
Dim matches As MatchCollection = sp.Matches(startpagina)
For Each itemcode As Match In matches
ListBox1.Items.Add(itemcode.Value.Split("""").GetValue(0))
Next
但是<a href=http://games.startkabel.nl>games.startkabel.nl</a></td>
没有""
所以列表框会显示整个代码,而我只需要这部分
games.startkabel.nl
我已经尝试将代码更改为:
"<a href=""http://games.startkabel.nl"">""games.startkabel.nl""</a></td>"
但是它没有显示任何结果。
有人可以帮我解决这个问题吗?
(抱歉我的英语不好)
答案 0 :(得分:0)
您是否尝试检索超链接网址或超链接名称?
itemcode.Value.Split("="c, "<"c, ">"c).GetValue(2)
将返回网址“http://games.startkabel.nl”
itemcode.Value.Split("="c, "<"c, ">"c).GetValue(3)
将返回超链接名称“games.startkabel.nl”