Question

抱歉，如果我要完全解决这个问题，因为我对jSoup非常陌生。

我正试图登录我学校的年级网站，以便从中刮取年级数据并将其显示在程序中。登录门户的链接是“ https://portal.mcpsmd.org/public/”，但是我要从中抓取数据的页面位于“ https://portal.mcpsmd.org/guardian/home.html#/termGrades”。

这是我要使用的代码，是我从另一个类似的堆栈溢出问题中获得的：

String url = "https://portal.mcpsmd.org/guardian/home.html#/termGrades";
Document doc =
Jsoup.connect("https://portal.mcpsmd.org/guardian/home.html#/termGrades")
            .data("fieldAccount","MY_SCHOOL_ID")
            .data("fieldPassword","MY_SCHOOL_PASSWORD")
            .userAgent("Mozilla")
            .post();
System.out.println(doc);

当前，当我运行该程序时，它会从登录页面而不是术语成绩页面中打印出数据。我想我想问的是，从需要我首先登录的网站上抓取数据的最佳方法是什么？我目前正在尝试构建一个Android应用程序，可以从我学校的网站上抓取数据，但是我不知道如何解决此登录屏幕。

跳过登录页面以便使用JSoup进行抓取

0 个答案: