我已经下载了Java HtmlParser,但我不知道如何使用API来提取HTML数据。你能给出一些例子,以便我可以开展工作吗?
答案 0 :(得分:2)
你在谈论HtmlParser?而是选择具有较少详细API的解析器,如Jsoup。您需要学习的只是CSS selectors,这对于普通的前端开发人员来说已经非常明显了。
这是一个启动示例,显示您当前的问题和所有回答者的姓名:
package com.stackoverflow.q3416036;
import java.net.URL;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Test {
public static void main(String[] args) throws Exception {
URL url = new URL("https://stackoverflow.com/questions/3416036");
Document document = Jsoup.parse(url, 3000);
String question = document.select("#question .post-text").text();
System.out.println("Question: " + question);
Elements answerers = document.select("#answers .user-details a");
for (Element answerer : answerers) {
System.out.println("Answerer: " + answerer.text());
}
}
}