如何查找特定元标记

时间:2011-11-21 21:03:27

标签: java html-parsing jsoup

我正在尝试使用java中的Jsoup解析器检索元标记(标记名称=生成器)。

我的代码如下:

Elements metalinks=doc.select("meta"); // meta

boolean metafound=false;
for (Element singlemeta : metalinks) 
{
    metatagname = singlemeta.attr("abs:name");
    metatagcontent = singlemeta.attr("abs:content");
    if((metatagname=="Generator")||(metatagname=="generator")||(metatagname=="GENERATOR")){
        //  this is the tag we want to get value of...
        metarequired=metatagcontent;
        metafound=true;
    }
}   
if(metafound==false)
    metarequired="NOT_FOUND";

但是我无法正确提取元GENERATOR标记。

现在,下面给出了这个标签的一个例子:

<meta name="generator" content="Test page" />

对于上面给出的代码中的第一行,我也尝试了以下代码,但这也不起作用:

//Elements metalinks= doc.getElementsByTag("meta");

如何正确提取元标记?

1 个答案:

答案 0 :(得分:10)

看起来好像你太复杂了。如果你开始使用这样简单的东西怎么办:

Elements metalinks = doc.select("meta[name=generator]");