使用SOCKETS VB.NET获取HTML页面源代码

时间:2012-05-04 06:52:55

标签: html vb.net parsing

我正在开发一个程序,可以在网站上获取某些网页的html源代码。

我已经开发了一个这样做的程序,这里是代码

     Dim request As System.Net.HttpWebRequest =     System.Net.HttpWebRequest.Create(TextBox2.Text)
     Dim response As System.Net.HttpWebResponse = request.GetResponse()

     Dim sr As System.IO.StreamReader = New      System.IO.StreamReader(response.GetResponseStream())

     Dim sourcecode As String = sr.ReadToEnd()
     TextBox1.Text = sourcecode

最近,我发现我可以使用套接字执行相同的操作。这次我想同时解析这些网页的HTML。我尝试使用多线程同时解析我以前的程序,但随着线程的增加,我的带宽不断减少,以便让我的问题简短,

  • 如何在不降低带宽的情况下同时解析多个网页的来源?
  • 在多线程中使用套接字是否会降低带宽? (如果有人尝试过)

如果我的问题不明确,请随时纠正我,我很乐意接受您的任何建议。

1 个答案:

答案 0 :(得分:0)

如果您正在使用多个同时进行的网络连接,那么使用更多的带宽可能并不是因为只使用一个连接就可以了?

每个套接字基本上都是一个连接,因此通过创建更多套接字并通过连接传输数据,可以增加应用程序尝试使用的带宽。