我需要验证BizTalk架构中元素的日期范围。我收到了结束日期之前的开始日期(20130521-20130501)。我知道我可以在地图中使用XSLT和C#轻松解析和验证此字符串,但是,我需要将验证作为模式的一部分,以便在收到具有此格式日期的事务时,BizTalk将拒绝EDI事务并向发件人发回999拒绝。
我已阅读过很多帖子,建议不要使用正则表达式验证日期范围,但除了创建自定义管道组件或使用C#之外,我没有看到任何其他方式。有一个schema属性允许使用正则表达式来验证输入数据。
我对正则表达式不太满意,需要一些帮助来确定如何验证开始日期是否小于或等于结束日期。日期以字符串形式接收。我已经阅读过关于在“ - ”上拆分字符串的内容,但不知道如何比较结果。任何帮助将不胜感激。
答案 0 :(得分:7)
免责声明:我正在使用PHP,这意味着我正在使用PCRE正则表达式。
您似乎没有意识到正则表达式的限制,但这没关系
真正的问题是以下解决方案:检查x =< y
是否匹配。
为什么?那么你想检查start date =< end date
。正则表达式的想法是匹配某个常规模式之后的某些字符。由于正则表达式没有逻辑运算符x < y
>
,因此单独使用正则表达式无法检查<
是否为x = y
。
正则表达式可以做的是检查是否x = y
。比方说,我有以下字符串,我想得到10 = 10
15 = 51
33 = 31
100 = 101
780 = 780
:
^(\d+)\s*=\s*\1$
我们可以使用以下正则表达式:m
和^
修饰符。这是什么意思?
(\d+)
:行首\s*=\s*
:将任意数字分组并匹配一次或多次=
:匹配空格0次或更多次,然后\1
然后任意空格0次或以上$
:引用第1组,因此只有在与第1组匹配的内容相同时才匹配。m
:行尾^
修饰符:多行。让$
和x-y
分别匹配行的开头和结尾
让我们进一步攻击。对于此POC,我们将匹配以下内容:0 =< x =< 9
其中0 =< y =< 9
和x =< y
以及x =< y
。
我们可以做的是尝试匹配所有x=0
的可能性。因此,如果y=[0-9]
然后x=1
,y=[1-9]
然后x=2
,y=[2-9]
则or
,依此类推。由于正则表达式具有0-[0-9]|1-[1-9]|2-[2-9]|3-[3-9]|4-[4-9]|5-[5-9]|6-[6-9]|7-[7-9]|8-[8-9]|9-9
语句,我们可以编写以下正则表达式:
$start = strtotime('2013-01-01'); // Start date
$end = strtotime('2013-03-01'); // End date
$range = array_map(function($v){return date('Ymd', $v);}, range($start, $end, 86400)); // Creating the range of dates
$result = ''; // Declaring an empty variable to store our regex in it
for($i=$start;$i<=$end;$i+=86400){ // loop each day
$result .= '(?:' . date('Ymd', $i) . '-(?:'. implode('|', $range) . '))|'; // building our regex
array_shift($range); // removing first element of range
}
$result = substr($result, 0, -1); // removing last | since we don't need it
echo $result; // Output
Online demo
你看 ?实际上,进行简单的比较需要很长时间!这就是为什么任何理智的人都会使用内置语言工具解析和验证它。
我们将使用PHP生成正则表达式:
2013-01-01
上述代码将生成一个正则表达式,可以2013-03-01
形式验证x =< y
和x-y
之间$string = '20130101-20130101
20130201-20130101
20130105-20130120
20130201-20130301
20130210-20130215
20130301-20130301
20130301-20130201
'; // A sample
$regex = file_get_contents('regex.txt'); // Get the regex from a file (which we generated previously)
preg_match_all('#'.$regex.'#', $string, $matches); // Let's regex !
print_r($matches[0]); // Printing the matches ...
的日期。此正则表达式未优化,大约 17KB 。如果我将其配置为验证10年的范围,那么想象一下这个正则表达式的大小?请注意,大小呈指数级增长。我尝试了4个月的间隔,但我得到一个错误/警告,说表达式太长了
由于正则表达式太长,我无法进行在线演示,但这里是PHP中的代码:
Array
(
[0] => 20130101-20130101
[1] => 20130105-20130120
[2] => 20130201-20130301
[3] => 20130210-20130215
[4] => 20130301-20130301
)
<强>输出:强>
{{1}}
Online dump of the regex | Online PHP demo
请不要考虑使用正则表达式执行此任务,否则您将遇到10个问题:)
答案 1 :(得分:0)
您可以将BizTalk Business Rules Engine Pipeline Framework与BRE政策结合使用来验证日期范围,而不是编写自己的自定义组件来进行验证。
完全披露:此框架由我的同事撰写。