我需要一个模式匹配器来获取来自http响应主体的以下文本中的页面id值。
<meta name="ajs-page-id" content="262250">
我所追求的是从此行获取始终在responsebody中生成的内容值。
答案 0 :(得分:2)
Pattern pat = Pattern.compile("<meta\\sname=\"ajs-page-id\"\\scontent=\"(\\d+)\">");
这显然是一个非常文字的模式......但是组(1)应该将数字作为字符串返回。 尚未测试过。
答案 1 :(得分:1)
使用像jsoup这样的HTML解析器来解析和搜索零件。你不应该使用正则表达式。
如,
String htmlStr = "<meta name=\"ajs-page-id\" content=\"262250\">";
Document doc = Jsoup.parse(htmlStr);
Element meta = doc.select("meta[name=ajs-page-id]").first();
if (meta != null)
{
System.out.println(meta.attr("content"));
}