为什么这个Java正则表达式不起作用?

时间:2012-06-20 11:43:21

标签: java regex

我有一个Java正则表达式,它从字符串中捕获堆栈异常:

((?s).+(?:Exception|Error)[^\n]++(?:\s+at .++)+)

matches我的输入字符串:

FOO - org.omg.CORBA.MARSHAL: com.ibm.ws.pmi.server.DataDescriptor; IllegalAccessException  minor code: 4942F23E    
         at com.ibm.rmi.io.ValueHandlerImpl.readValue(ValueHandlerImpl.java:199)
         at com.ibm.rmi.iiop.CDRInputStream.read_value(CDRInputStream.java:1429)
         at com.ibm.rmi.io.ValueHandlerImpl.read_Array(ValueHandlerImpl.java:625)
         at com.ibm.rmi.io.ValueHandlerImpl.readValueInternal(ValueHandlerImpl.java:273)
         at com.ibm.rmi.io.ValueHandlerImpl.readValue(ValueHandlerImpl.java:189)
         at com.ibm.rmi.iiop.CDRInputStream.read_value(CDRInputStream.java:1429)
         at com.ibm.ejs.sm.beans._EJSRemoteStatelessPmiService_Tie._invoke(_EJSRemoteStatelessPmiService_Tie.java:613)
         at com.ibm.CORBA.iiop.ExtendedServerDelegate.dispatch(ExtendedServerDelegate.java:515)
         at com.ibm.CORBA.iiop.ORB.process(ORB.java:2377)
         at com.ibm.CORBA.iiop.OrbWorker.run(OrbWorker.java:186)
         at com.ibm.ejs.oa.pool.ThreadPool$PooledWorker.run(ThreadPool.java:104)
         at com.ibm.ws.util.CachedThread.run(ThreadPool.java:137)< newline here >

但如果我将模式扩展到:

FOO - ((?s).+(?:Exception|Error)[^\n]++(?:\s+at .++)+)\n

no longer matches。那是为什么?

2 个答案:

答案 0 :(得分:1)

即使字符串在结尾处确实有换行符,也不匹配,因为最终的\n已经与.++匹配(您正在使用(?s)选项)。由于.++具有贪婪占有性,它会将所有内容与字符串末尾匹配,而不会回溯,因此\n将始终失败。

答案 1 :(得分:0)

似乎最后一个表达式组正在捕获所有内容,包括表达式中该字符串的结尾。因此,添加\ n将不会被发现,因为它已经是早期组的一部分。

所以,测试使用:

FOO - ((?s)。+(?:Exception | Error)([^ \ n] ++)((?:\ s + at。++)+))

您将看到由其捕获的组。你会看到那里的最后一组包括EOL等所有内容。