长字符串上的Java正则表达式(String buffer)

时间:2014-06-14 10:15:26

标签: java regex stringbuffer

我实际上有2个问题。 第一个理论 - 如果我在StringBuffer中有一个长文本并且我想在其中找到一个正则表达式 - 我是否必须担心StringBuffer将采用StringBuffer的块来查找每个块内部的正则表达式,如果它在任何块中都没有找到这样的正则表达式,就好像文本里面的正则表达式不存在一样?如果正则表达式的一部分位于一个块的边界,并且正则表达式的其余部分位于相邻块的边界,该怎么办?

第二名:

String patternString1 = "(\\[\\[Category.*\\]\\])";
Pattern pattern1 = Pattern.compile(patternString1);
Matcher matcher1 = pattern1.matcher(text);
while (matcher1.find()){
System.out.println(matcher1.group(1));
}

我想从字符串中提取所有看起来像[[Category:。*]]的表达式,但是如果整个文本看起来像这样:

[[类别:PrintingOut [[打印机HP]] [[HewlettPackard]] ]] [[LaserJet]]

我想确保“]] ”是我正则表达式的结尾。换句话说 - 如果我在表达式中找到[[。*]],我不希望将内部[[。*]]的结尾视为整个表达式的结尾。

1 个答案:

答案 0 :(得分:1)

这可能会对你有帮助。

\[\[Category:.*?\s\]\]

以下是Debuggex

上的演示

修改

如果在关闭]]

之前有空格,请尝试使用以下正则表达式
\[\[Category:.*?[(\]\])\s]+\]\]

以下是Debuggex

上的演示

注意:只需将此正则表达式模式包含在()中,然后将该组放在索引1处。