Question

我做了这个示例，通过java应用程序请求一个url查询。请求连接和查询是正确的。但是，我想知道如何从查询中获取所有href元素并在一个输出文件上写入？任何人都有指导方针吗？

提前致谢

Document engineSearch=Jsoup.connect("http://ask.com/web?q="+URLEncoder.encode(query))
                                        .userAgent("Mozilla/5.0 (X11; U; Linux x86_64; en-GB; rv:1.8.1.6) Gecko/20070723 Iceweasel/2.0.0.6 (Debian-2.0.0.6-0etch1)")
                                        .get();
            String title = engineSearch.title();
            Elements links = engineSearch.select("a[href]").first().getAllElements();

            String queryEncoding=engineSearch.outputSettings().charset().name();

        file = new File(folder.getPath()+"\\"+date+" "+Tag+".html");

        OutputStreamWriter writer = new OutputStreamWriter(new FileOutputStream(file),queryEncoding);
        writer.write(engineSearch.html());
        writer.close();

Answer 1

以下是您想要的一个示例，我没有方便的开发环境，但这些内容应该有效

http://jsoup.org/cookbook/extracting-data/attributes-text-html

Document doc = Jsoup.parse(html);
Elements links = doc.select("a");

for (Element e : links) {
 String text = doc.body().text(); // "An example link"
 String linkHref = link.attr("href"); // "http://example.com/", which you can save to file
}

Jsoup href请求和输出文件

1 个答案: