在HTML文件中,我需要在两个子字符串之间提取日期字符串。
示例字符串:
<A HREF="actuals_ADAPS_20150517_3.txt"></A> <A HREF="actuals_ADAPS_20150517_3.txt">actuals_ADAPS_20150517_3.t></A> May 17 00:50 4k <A HREF="actuals_ADAPS_20150518_1.txt"></A> <A HREF="actuals_ADAPS_20150518_1.txt">actuals_ADAPS_20150518_1.t></A> May 17 18:50 4k <A HREF="actuals_ADAPS_20150518_3.txt"></A> <A HREF="actuals_ADAPS_20150518_3.txt">actuals_ADAPS_20150518_3.t></A> May 18 00:50 4k
示例字符串表示3个文本文件及其关联时间。
我需要提取每个文件的时间。
我已经通过了REGEX路线但是没有能够得到正确的路线。
到目前为止代码:
<cfdump var="#REMatch('actuals_METR_YOUNN_20150520_3.t>(.*)4k',html)#">
代码不对,但是我想知道我的目标。
对于文件名:actuals_ADAPS_20150517_3.txt
预期产出:
May 17 00:50
当前输出:
注意:根据评论中的Leigh,ReMatch(遗憾的是)返回匹配的整个字符串,而不是像您期望的那样只返回分组表达式。
我必须使用REReplace
顶部的ReMatch
来获得所需的输出。
感谢大家的帮助。
答案 0 :(得分:2)
您走在正确的轨道上......只需添加.*
,即可让?
贪婪,并在其后添加\s*
排除尾随空格。
actuals_ADAPS_20150517_3\.t><\/A>\s*(.*?)\s*4k
请参阅DEMO