我想问一下如何从谷歌搜索结果中提取文本和网址,就像谷歌一样。 我只有这个代码,但我不知道如何使vb.net正则表达式。 我只需要知道如何提取文本和网址的所有内容。 或者您可以建议其他正则表达式代码,但这样做与示例中的相同。
示例:
文字 - <h3 class="r"><a href="http://www..com/"><b>Welcome to dog training courses</b></a>
网址 - <a href="http://..com/">Any link</a>
示例:
文字 - Welcome to dog training courses
网址 - www.dogtraining.com
文字 - Welcome to Learning About Dogs
网址 - www.learningaboutdogs.com
ListBox1.Items.Clear() Dim wc As New WebClient Dim source As String = wc.DownloadString("http://www.google.com/search?&q=" + TextBox1.Text) Dim m1 As MatchCollection = Regex.Matches(source, "", RegexOptions.Singleline + RegexOptions.IgnoreCase) For Each m As Match In m1 Dim value As String = m.Groups(0).Value If Not value.Contains("google") Then ListBox1.Items.Add(value) End If Next