如何使用Jsoup管理cookie?

时间:2012-01-30 19:05:44

标签: java cookies jsoup

Jsoup中是否有一个简单的cookie管理器可以存储主机的cookie? this thread 中的例子非常缺乏。

2 个答案:

答案 0 :(得分:9)

我没有找到适用于Jsoup的标准解决方案。这是我使用HashMap处理的简单cookie。它可能缺少一系列功能,但我希望它对我的基本爬虫来说效果不错:

private static HashMap<String, HashMap<String, String>> host2cookies = new HashMap<String, HashMap<String, String>>();

public static String[] DownloadPage(URL url) throws Exception
{
    Connection con = Jsoup.connect(url.toString()).timeout(600000);
    loadCookiesByHost(url, con);


    Document doc = con.get();
    url = con.request().url();

    storeCookiesByHost(url, con);

    return new String[]{url.toString(), doc.html()};
}

private static void loadCookiesByHost(URL url, Connection con) {
    try {
        String host = url.getHost();
        if (host2cookies.containsKey(host)) {
            HashMap<String, String> cookies = host2cookies.get(host);
            for (Entry<String, String> cookie : cookies.entrySet()) {
                con.cookie(cookie.getKey(), cookie.getValue());
            }
        }
    } catch (Throwable t) {
        // MTMT move to log
        System.err.println(t.toString()+":: Error loading cookies to: " + url);
    }
}

private static void storeCookiesByHost(URL url, Connection con) {
        try {
            String host = url.getHost();
            HashMap<String, String> cookies = host2cookies.get(host);
            if (cookies == null) {
                cookies = new HashMap<String, String>();
                host2cookies.put(host, cookies);
            }
            cookies.putAll(con.response().cookies());
        } catch (Throwable t) {
            // MTMT move to log
            System.err.println(t.toString()+":: Error saving cookies from: " + url);
        }    
}   

答案 1 :(得分:2)

Connection.Base课程包含了有关jsoup如何处理cookie的所有信息。

基本上,它可以让你在每个连接上获取和设置它们,但除此之外,你可以“管理”它们。