跳过登录页面以便使用JSoup进行抓取

时间:2019-04-22 13:32:30

标签: java android jsoup

抱歉,如果我要完全解决这个问题,因为我对jSoup非常陌生。

我正试图登录我学校的年级网站,以便从中刮取年级数据并将其显示在程序中。登录门户的链接是“ https://portal.mcpsmd.org/public/”,但是我要从中抓取数据的页面位于“ https://portal.mcpsmd.org/guardian/home.html#/termGrades”。

这是我要使用的代码,是我从另一个类似的堆栈溢出问题中获得的:

String url = "https://portal.mcpsmd.org/guardian/home.html#/termGrades";
Document doc =
Jsoup.connect("https://portal.mcpsmd.org/guardian/home.html#/termGrades")
            .data("fieldAccount","MY_SCHOOL_ID")
            .data("fieldPassword","MY_SCHOOL_PASSWORD")
            .userAgent("Mozilla")
            .post();
System.out.println(doc);

当前,当我运行该程序时,它会从登录页面而不是术语成绩​​页面中打印出数据。我想我想问的是,从需要我首先登录的网站上抓取数据的最佳方法是什么?我目前正在尝试构建一个Android应用程序,可以从我学校的网站上抓取数据,但是我不知道如何解决此登录屏幕。

0 个答案:

没有答案