我一直在使用这个PDF比较工具(ExamDiff Pro),我试图弄清楚如何排除任何与潜在日期相匹配的单词。我正在比较的文档上的特定日期格式使用类似:“2014年1月20日”
有人可以帮我弄清楚这个正则表达式吗?
我已经找到了类似问题的结果,但它们对我来说只是差异不足以解决问题:/
谢谢!
答案 0 :(得分:4)
我不确定你的工具是如何工作的,但是这里应该找到你想要的样品:
\w{3,9}?\s\d{1,2}?\s,\s\d{4}?
第1部分:\w{3,9}?
- 找到3到9个字符之间的单词字符序列,尽可能多次(短= May(3),long = 9月(9))
第2部分。\s
- 这就是所谓的“空白”或空白区域,如果你愿意的话
第3部分:\d{1,2}?
- 这样可以找到一个数字序列(0-9),一次是偶数次,也是两次尽可能多次(意味着1-31范围)
第4部分:\s,\s
- 这会找到一个空格,然后是逗号,然后是另一个空格
第5部分:\d{4}?
- 它会尽可能少地找到4位数的序列(1000 - 2014年及以后)
这足以满足您的需求吗?
答案 1 :(得分:3)
我从未使用过ExamDiff,但从他们那里看regex help page,我想我可以提供帮助。
我认为以下正则表达式应该以您指定的格式为您提供日期。
\w+\s\d{2},\s\d{4}
说明:
\w+ -- Find one or more word characters
\s -- a white space character
\d{2} -- 2 digits
, -- a literal comma
\s -- another space
\d{4} -- 4 digits
答案 2 :(得分:0)
您可以尝试^[0][0-9]([1][0-2])$
查看从01到12的月份