登录网站

时间:2013-09-08 20:36:25

标签: c# login screen-scraping

我是C#的新手,但碰巧我需要以编程方式登录到特定的网站,以便在C#中进行屏幕抓取。我已经完成了在线研究(这个网站特别有用),我了解到我需要使用以下对象/类之一才能登录:WebRequest/WebResponseHttpWebRequest/HttpWebResponse,{{ 1}},以及我需要将从网站收到的cookie传递给后续(屏幕抓取)请求。但是,我无法成功登录,此时我的想法已经用完了。我想登录主页------然后屏幕抓了一些像这样的页面:-------。该网站的工作方式如下:它允许访问我所引用的页面,但除非用户登录,否则它会在某些字段中返回星号。我认为这意味着内容是动态生成的,我怀疑这可能是我登录麻烦的根本原因。我包含了用于登录网站的代码:

WebClient

尝试使用HttpWebRequest / HttpWebResponse登录以及尝试使用WebRequest / WebResponse登录都不起作用。第一个返回一个如下所示的cookie:     PHPSESSID = hncrr0 ... 第二个返回一个看起来像这样的cookie:     PHPSESSID = 88dn1n9 ...;路径= / 这些饼干对我来说很可疑。一方面,它们看起来与IE中的cookie不同。但我不知道究竟应该期待什么。 (我也尝试将通过(Http)WebRequest /(Http)WebResponse收到的cookie传递给WebClient但又无效 - 我不在此处将其包括在内以节省空间。)

我非常感谢任何意见。如果有人想运行代码,我实际上可以提供实际的登录/密码信息(无论如何,该网站上的注册都是免费的)。

0 个答案:

没有答案