所以,我在JSoup中遇到了问题。
我需要解析HTML页面以获取一些表单输入值,如下所示:
<input value="210cf5f0c2db3ac6ac5112881525cfff" data-value="1355317682" type="hidden" name="token" />
<input type="hidden" name="sid" value="18c03bc9nkedyyjmbzgvmkv5tx7yhyw1" />
<input value="" name="redirect" type="hidden" />
<input value="d3edfe5b37608758516833b858b51b63" type="hidden" name="eyhy7xt5v" />
我需要能够获取每个输入的值,但一次只能获取一个。我当前的Java代码如下所示:
import org.jsoup.Jsoup;
import org.jsoup.helper.Validate;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;
class JSoupTest {
public static void main(String[] args) throws IOException {
Document doc = Jsoup.connect("http://url.com/auth").get();
Elements inputs = doc.select("input");
for(Element input : inputs) {
System.out.println(input.attr("name"));
System.out.println(input.attr("value"));
}
}
}
它当前转储所有输入的名称及其值,但我需要程序只输出某个输入字段的值。
就像说,我想输出名为“sid”的输入字段的值。我只需打印那个值,其他都没有。
我想要以某种方式做那样的选择性打印,我想你可以说。只需打印某个输入字段的值即可。
有谁知道怎么做?
在JSoup文档中,我一直在关注this page,但我找不到我想要的内容。
谢谢!
编辑:我刚刚意识到,每次刷新页面时都会随机生成最后一个值的名称。如果除了“隐藏”特征之外没有任何值保持不变,有没有办法抓住它?
答案 0 :(得分:3)
如果我理解正确,以下代码可以满足您的需求:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class MyParser {
public static void main(String args[]) {
String inputText =
"<input value=\"210cf5f0c2db3ac6ac5112881525cfff\" data-value=\"1355317682\" type=\"hidden\" name=\"token\" />"
+ "<input type=\"hidden\" name=\"sid\" value=\"18c03bc9nkedyyjmbzgvmkv5tx7yhyw1\" />"
+ "<input value=\"\" name=\"redirect\" type=\"hidden\" />"
+ "<input value=\"d3edfe5b37608758516833b858b51b63\" type=\"hidden\" name=\"eyhy7xt5v\" />" ;
Document doc = Jsoup.parseBodyFragment(inputText);
Element body = doc.body();
// Grab the value attribute of the INPUT element with a given name attribute
Element input = body.select("input[name=sid]").first();
System.out.println(input.attr("value"));
// Grab the value attribute of the last INPUT element
Element lastInput = body.select("input").last();
System.out.println(lastInput.attr("value"));
}
}
您可以使用以下语法为input
属性选择具有给定值的name
元素:
element.select("tag_name[attr_name=value]")
这将返回仅包含一个元素的Elements
对象(因为name
属性的值是唯一的。)
您说具有更改input
属性的name
元素是最后一个input
,因此您可以通过获取包含所有内容的Elements
对象来利用这些知识input
元素并取出最后一个元素。