抱歉,如果我要完全解决这个问题,因为我对jSoup非常陌生。
我正试图登录我学校的年级网站,以便从中刮取年级数据并将其显示在程序中。登录门户的链接是“ https://portal.mcpsmd.org/public/”,但是我要从中抓取数据的页面位于“ https://portal.mcpsmd.org/guardian/home.html#/termGrades”。
这是我要使用的代码,是我从另一个类似的堆栈溢出问题中获得的:
String url = "https://portal.mcpsmd.org/guardian/home.html#/termGrades";
Document doc =
Jsoup.connect("https://portal.mcpsmd.org/guardian/home.html#/termGrades")
.data("fieldAccount","MY_SCHOOL_ID")
.data("fieldPassword","MY_SCHOOL_PASSWORD")
.userAgent("Mozilla")
.post();
System.out.println(doc);
当前,当我运行该程序时,它会从登录页面而不是术语成绩页面中打印出数据。我想我想问的是,从需要我首先登录的网站上抓取数据的最佳方法是什么?我目前正在尝试构建一个Android应用程序,可以从我学校的网站上抓取数据,但是我不知道如何解决此登录屏幕。