我想使用Jsoup和HttpClient自动发布大量HTML表单。这些表单中的大多数都有隐藏字段(使用会话ID等)或具有默认值,我宁愿单独留下。
单独编写每个表单提交 - 从页面中提取每个隐藏或默认值 - 非常繁琐,所以我考虑编写一个通用方法来获取给定表单的HTTP参数列表。 / p>
这不是一个简单的代码片段,因为输入标签和字段类型的多样性,每个都需要特定的处理(例如textareas,复选框,单选按钮,选择......)所以我想我先搜索/询问它是否已经存在。
注意:Jsoup和HttpClient是给定的;我无法改变 - 所以请不要提供建议其他解决方案的答案:我有一个Jsoup Document对象,我需要构建一个HttpClient HttpRequest。
答案 0 :(得分:3)
所以我最终写了它。我仍然宁愿交换经过现场测试的东西(并希望在其他地方进行维护),但万一它可以帮助任何人降落在这里...
未经过彻底测试且不支持multipar / form-data,但在我尝试过的几个示例中有效:
public void submit(String formSelector, List<String> params) {
if (params.size() % 2 != 0) {
throw new Exception("There must be an even number of params.");
}
Element form= $(formSelector).first();
Set<String> newParams= Sets.newHashSet();
for (int i=0; i < params.size(); i+= 2) {
newParams.add(params.get(i));
}
List<String> allParams= Lists.newArrayList(params);
for (Element field: form.select("input, select, textarea")) {
String name= field.attr("name");
if (name == null || newParams.contains(name)) continue;
String type= field.attr("type").toLowerCase();
if ("checkbox".equals(type) || "radio".equals(type)) {
if (field.attr("checked") != null) {
allParams.add(field.attr("name"));
allParams.add(field.attr("value"));
}
}
else if (! fieldTypesToIgnore.contains(type)) {
allParams.add(field.attr("name"));
allParams.add(field.val());
}
}
String action= form.attr("abs:action");
String method= form.attr("method").toLowerCase();
// String encType= form.attr("enctype"); -- TODO
if ("post".equals(method)) {
post(action, allParams);
}
else {
get(action, allParams);
}
}
($,get,and post是我已经躺在那里的方法......你可以很容易地猜出他们做了什么)。
答案 1 :(得分:0)
Jsoup在formData
类中有一个FormElement
方法;它在简单的情况下工作,但它并不总能满足我的需要,所以我最终也编写了一些自定义代码。