使用WebClient或WebRequest登录网站并访问数据

时间:2013-06-19 05:46:51

标签: c# login webclient html-form webrequest

我正在尝试使用WebClient / WebRequest访问网站上的受限数据。该网站没有官方API,所以我要做的只是填写HTML表单并将值发布到服务器,这样我就登录了。

我尝试了thisthis,但看起来似乎没有登录即将发出的请求。

后一个例子更具吸引力,因为我显然更喜欢WebClient,但遗留WebRequest会这样做。

无论如何,在第一个例子中,我认为它确实登录了,但即将到来的访问私有数据的请求会返回一个页面,上面写着“这只是会员内容”。

如何永久登录WebClient

2 个答案:

答案 0 :(得分:23)

更新

请参阅下面的my comment


这是我所做的并且有效(credit)。

首先添加此课程:

namespace System.Net
{
  using System.Collections.Specialized;
  using System.Linq;
  using System.Text;

  public class CookieAwareWebClient : WebClient
  {
    public void Login(string loginPageAddress, NameValueCollection loginData)
    {
      CookieContainer container;

      var request = (HttpWebRequest)WebRequest.Create(loginPageAddress);

      request.Method = "POST";
      request.ContentType = "application/x-www-form-urlencoded";

      var query = string.Join("&", 
        loginData.Cast<string>().Select(key => $"{key}={loginData[key]}"));

      var buffer = Encoding.ASCII.GetBytes(query);
      request.ContentLength = buffer.Length;
      var requestStream = request.GetRequestStream();
      requestStream.Write(buffer, 0, buffer.Length);
      requestStream.Close();

      container = request.CookieContainer = new CookieContainer();

      var response = request.GetResponse();
      response.Close();
      CookieContainer = container;
    }

    public CookieAwareWebClient(CookieContainer container)
    {
      CookieContainer = container;
    }

    public CookieAwareWebClient()
      : this(new CookieContainer())
    { }

    public CookieContainer CookieContainer { get; private set; }

    protected override WebRequest GetWebRequest(Uri address)
    {
      var request = (HttpWebRequest)base.GetWebRequest(address);
      request.CookieContainer = CookieContainer;
      return request;
    }
  }
}

用法:

public static void Main()
{
  var loginAddress = "www.mywebsite.com/login";
  var loginData = new NameValueCollection
    {
      { "username", "shimmy" },
      { "password", "mypassword" }
    };

  var client = new CookieAwareWebClient();
  client.Login(loginAddress, loginData);
}

答案 1 :(得分:5)

HTTP是无状态的。因此,WebClient无法永久登录.HTTP中不存在会话的概念。服务器端技术(如ASP.NET)通过使用cookie的会话概念或在每个请求中来回发送的查询字符串参数来模拟有状态行为。话虽如此,可以模仿浏览器从WebClient做的事情。如果您有权访问该网站,请使用正确的凭据连接到该网站,并使用Fiddler捕获流量。然后,确保WebClient发送正确的cookie,请求标题,查询字符串等与浏览器完全相同。