我正在尝试从网站解析html代码以显示我正在处理的程序的java元素。
我一直在寻找 jsoup库来解析 arso.si 中的html。
任何建议如何解析代码的特定部分以及用于在我的程序中显示它的元素。 谢谢你的帮助。
答案 0 :(得分:0)
以下是使用jsoup
解析html
public static void parseTitleData(String response){
if (response!=null&&!"".equals(response)) {
Document doc = Jsoup.parse(response);
//css selector
Elements linksElements = doc.select("div[class=article_list mtop10]>ul>li>a");
for (Element ele:linksElements) {
String href = ele.attr("href");
String title = ele.text();
News news =new News();
news.setPath(href);
news.setTitle(title);
}
}
}
答案 1 :(得分:0)
根据我的理解,您正试图占用网站的某些部分,并在您的应用程序上以可视方式显示它。
你可以使用Selenium(http://www.seleniumhq.org/projects/webdriver/)。
您可以使用PhantomJSDriver访问该网站,然后调用getScreenshotAs
函数(更多信息和示例可在此处找到:http://www.seleniumhq.org/docs/04_webdriver_advanced.jsp)。