网站通过Jsoup刮痧

时间:2012-07-06 10:05:17

标签: web screen-scraping jsoup


我花了几个小时使用jsoup登录网站。但它总是提供相同的登录页面。
为了澄清我在facebook网站上尝试过的问题。它也给出了相同的结果。 下面我提到了我的代码

String url ="http://www.facebook.com/";
Document doc;
doc = Jsoup.connect(url)
      .data("email","abc@gmail.com","pass","xyz")
      .userAgent("Mozilla").post();
System.out.println(doc);

任何人都可以指出我犯了错误的地方,我该如何解决这个问题呢? 在数据部分“电子邮件”和“传递”是facebook登录页面的输入字段ID。
谢谢。

1 个答案:

答案 0 :(得分:3)

试试这个:

String url ="http://www.facebook.com/";
        Document doc;
        doc = Jsoup.connect(url)
        .data("email","abc@gmail.com")
        .data("pass","xyz")
        .userAgent("Mozilla")
        .post();

无论如何,Jsoup 一点都不差,你只需要如何正确使用它,但你还需要记住Facebook期待更多的参数来成功登录POST模拟网页导航。

以示例:

charset_test
default_persistent
lgnjs
lgnrnd
现场
LSD 通过
持续
时区

如果您需要进行身份验证并获取正确的数据,我建议您必须尝试使用​​适用于Android的Facebook SDK:

https://github.com/facebook/facebook-android-sdk/