我使用jsoup来抓取特定网站的内容。
示例,元标记:
String meta_description = doc.select("meta[name=description]").first().attr("content");
我需要抓取的是语言,我做的是:
String meta_language = doc.select("http-equiv").first().attr("content");
但抛出的是什么:
java.lang.NullPointerException
有人可以帮忙吗?
问候!
答案 0 :(得分:1)
试试这个:
String meta_language = doc.select("meta[name=http-equiv]").get(0).attr("content");
System.out.println("Meta description : " + meta_language);
但是,如果您的元标记中包含内容列表,则可以使用以下内容:
//get meta keyword content
String keywords = doc.select("meta[name=keywords]").first().attr("content");
System.out.println("Meta keyword : " + keywords);