我尝试使用Jsoup来获取ACM-DL文章的摘要。 但它没有得到
这是网站: http://dl.acm.org/citation.cfm?id=1999265&coll=DL&dl=GUIDE&CFID=698338637&CFTOKEN=48876455
这是我的代码部分
Elements PapaerElm = PaprtDoc.select("div div div p");
for(Element tempAbstract :PapaerElm){
System.out.println(tempAbstract);
}
我怎样才能正确地得到摘要?
感谢。
答案 0 :(得分:0)
由于div的id是“abstract”,你可以这样做:
Element content = document.getElementById("abstract");
然后解析元素以获取div中的段落:
Elements paragraphs = content.getElementsByTag("p");
然后迭代以找到所需的摘要。
答案 1 :(得分:0)
摘要通过AJAX调用加载。我使用Chrome网络工具提取此直接网址:
http://dl.acm.org/tab_abstract.cfm?id=1999265
因此,ID似乎来自您的原始网址。 (我删除了其他东西,包括令牌,因为似乎不需要得到摘要)