ASP.net:刮掉部分webage

时间:2012-05-31 21:31:02

标签: asp.net scrape

     Dim url As New Uri("http://www.testpage.com")
    If url.Scheme = Uri.UriSchemeHttp Then
        'Create Request Object
        Dim objRequest As HttpWebRequest = DirectCast(HttpWebRequest.Create(url), HttpWebRequest)
        'Set Request Method
        objRequest.Method = WebRequestMethods.Http.[Get]
        'Get response from requested url
        Dim objResponse As HttpWebResponse = DirectCast(objRequest.GetResponse(), HttpWebResponse)
        'Read response in stream reader
        Dim reader As New StreamReader(objResponse.GetResponseStream())
        Dim tmp As String = reader.ReadToEnd()
        objResponse.Close()
        'Set response data to container
        Label1.Text = tmp
    End If

我如何只抓取网页的一部分..代码succesfulyl获取完整的HTML内容。

例如..我想在<div id="content"> </div>

之间进行疏导

1 个答案:

答案 0 :(得分:1)

在页面变量中包含页面的完整html内容后,可以在此字符串上使用正则表达式返回要提取的部分。

由于您没有提供有关要提取的内容的详细信息,因此我将为您提供有关如何使用正则表达式的链接。

可以找到正则表达式的简短教程here