我有一些html需要从中提取值,我无法弄清楚如何使用jsoup来获取它。下面是提取内容的片段。我预计不止一个元素需要迭代并提取:
<a href="javascript:runReport('R_195','/action/reports/project/costing/periodic/summary/report');">
我需要检索的内容包含在括号内以及单引号内的值。
例如,我第一次传球的预期结果是返回R_195
我的第二遍将是/ action / reports / project / costing / periodic / summary / report
如何使用jsoup始终如一地获取第一组&#39;&#39;和第二套&#39;&#39;?看起来很简单,但我一直在试图解决这个问题。 jsoup和java的新手!
提前致谢!
答案 0 :(得分:0)
当你自己弄明白时,这很好。我真正需要的是插入一点java。心灵被困在jsoup中,我忘记了所有我正在处理的是一堆字符串!下面是我的代码,其他任何可能像我一样撞墙的人......
// Get the reportID and address from the href text
int r = 0;
for(Element telemetryReport : telemetryReports) {
String reportID = telemetryReport.attr("href").toString();
reportID = reportID.substring(reportID.indexOf("'")+1);
reportID = reportID.substring(0, reportID.indexOf("'"));
unanetReportIDArray[r]=reportID;
// Get the address
String reportAddress = telemetryReport.attr("href").toString();
reportAddress = reportAddress.substring(reportAddress.indexOf("','")+3);
reportAddress = reportAddress.substring(0, reportAddress.indexOf("');"));
unanetAddressArray[r]=reportAddress;
System.out.println(unanetAddressArray[r]);
}