在JSoup中按名称查找字符串值

时间:2012-12-12 13:22:06

标签: java html parsing jsoup

所以,我在JSoup中遇到了问题。

我需要解析HTML页面以获取一些表单输入值,如下所示:

<input value="210cf5f0c2db3ac6ac5112881525cfff" data-value="1355317682" type="hidden" name="token" />
<input type="hidden" name="sid" value="18c03bc9nkedyyjmbzgvmkv5tx7yhyw1" />
<input value="" name="redirect" type="hidden" />
<input value="d3edfe5b37608758516833b858b51b63" type="hidden" name="eyhy7xt5v" /> 

我需要能够获取每个输入的值,但一次只能获取一个。我当前的Java代码如下所示:

import org.jsoup.Jsoup;
import org.jsoup.helper.Validate;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;

class JSoupTest {
    public static void main(String[] args) throws IOException {
        Document doc = Jsoup.connect("http://url.com/auth").get();
        Elements inputs = doc.select("input");
        for(Element input : inputs) {
            System.out.println(input.attr("name"));
            System.out.println(input.attr("value"));
        }
    }
}

它当前转储所有输入的名称及其值,但我需要程序只输出某个输入字段的值。

就像说,我想输出名为“sid”的输入字段的值。我只需打印那个值,其他都没有。

我想要以某种方式做那样的选择性打印,我想你可以说。只需打印某个输入字段的值即可。

有谁知道怎么做?

在JSoup文档中,我一直在关注this page,但我找不到我想要的内容。

谢谢!

编辑:我刚刚意识到,每次刷新页面时都会随机生成最后一个值的名称。如果除了“隐藏”特征之外没有任何值保持不变,有没有办法抓住它?

1 个答案:

答案 0 :(得分:3)

如果我理解正确,以下代码可以满足您的需求:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class MyParser {
    public static void main(String args[]) {
        String inputText = 
            "<input value=\"210cf5f0c2db3ac6ac5112881525cfff\" data-value=\"1355317682\" type=\"hidden\" name=\"token\" />"
            + "<input type=\"hidden\" name=\"sid\" value=\"18c03bc9nkedyyjmbzgvmkv5tx7yhyw1\" />"
            + "<input value=\"\" name=\"redirect\" type=\"hidden\" />"
            + "<input value=\"d3edfe5b37608758516833b858b51b63\" type=\"hidden\" name=\"eyhy7xt5v\" />" ;
        Document doc = Jsoup.parseBodyFragment(inputText);
        Element body = doc.body();
        // Grab the value attribute of the INPUT element with a given name attribute
        Element input = body.select("input[name=sid]").first();
        System.out.println(input.attr("value"));
        // Grab the value attribute of the last INPUT element
        Element lastInput = body.select("input").last();
        System.out.println(lastInput.attr("value"));
    }
}

您可以使用以下语法为input属性选择具有给定值的name元素:

element.select("tag_name[attr_name=value]")

这将返回仅包含一个元素的Elements对象(因为name属性的值是唯一的。)

您说具有更改input属性的name元素是最后一个input,因此您可以通过获取包含所有内容的Elements对象来利用这些知识input元素并取出最后一个元素。