BizTalk EDI架构中的日期范围验证

时间:2013-06-07 00:21:58

标签: xml regex biztalk edi

我需要验证BizTalk架构中元素的日期范围。我收到了结束日期之前的开始日期(20130521-20130501)。我知道我可以在地图中使用XSLT和C#轻松解析和验证此字符串,但是,我需要将验证作为模式的一部分,以便在收到具有此格式日期的事务时,BizTalk将拒绝EDI事务并向发件人发回999拒绝。

我已阅读过很多帖子,建议不要使用正则表达式验证日期范围,但除了创建自定义管道组件或使用C#之外,我没有看到任何其他方式。有一个schema属性允许使用正则表达式来验证输入数据。

我对正则表达式不太满意,需要一些帮助来确定如何验证开始日期是否小于或等于结束日期。日期以字符串形式接收。我已经阅读过关于在“ - ”上拆分字符串的内容,但不知道如何比较结果。任何帮助将不胜感激。

2 个答案:

答案 0 :(得分:7)

  

免责声明:我正在使用PHP,这意味着我正在使用PCRE正则表达式。

问题

您似乎没有意识到正则表达式的限制,但这没关系 真正的问题是以下解决方案:检查x =< y是否匹配。

限制

为什么?那么你想检查start date =< end date。正则表达式的想法是匹配某个常规模式之后的某些字符。由于正则表达式没有逻辑运算符x < y >,因此单独使用正则表达式无法检查<是否为x = y

绕过某个限制

正则表达式可以做的是检查是否x = y。比方说,我有以下字符串,我想得到10 = 10 15 = 51 33 = 31 100 = 101 780 = 780

所有的行
^(\d+)\s*=\s*\1$

我们可以使用以下正则表达式:m^修饰符。这是什么意思?

  • (\d+):行首
  • \s*=\s*:将任意数字分组并匹配一次或多次
  • =:匹配空格0次或更多次,然后\1然后任意空格0次或以上
  • $:引用第1组,因此只有在与第1组匹配的内容相同时才匹配。
  • m:行尾
  • ^修饰符:多行。让$x-y分别匹配行的开头和结尾
    Online demo

概念证明

让我们进一步攻击。对于此POC,我们将匹配以下内容:0 =< x =< 9其中0 =< y =< 9x =< y以及x =< y
我们可以做的是尝试匹配所有x=0的可能性。因此,如果y=[0-9]然后x=1y=[1-9]然后x=2y=[2-9]or,依此类推。由于正则表达式具有0-[0-9]|1-[1-9]|2-[2-9]|3-[3-9]|4-[4-9]|5-[5-9]|6-[6-9]|7-[7-9]|8-[8-9]|9-9语句,我们可以编写以下正则表达式:
$start = strtotime('2013-01-01'); // Start date $end = strtotime('2013-03-01'); // End date $range = array_map(function($v){return date('Ymd', $v);}, range($start, $end, 86400)); // Creating the range of dates $result = ''; // Declaring an empty variable to store our regex in it for($i=$start;$i<=$end;$i+=86400){ // loop each day $result .= '(?:' . date('Ymd', $i) . '-(?:'. implode('|', $range) . '))|'; // building our regex array_shift($range); // removing first element of range } $result = substr($result, 0, -1); // removing last | since we don't need it echo $result; // Output
Online demo
你看 ?实际上,进行简单的比较需要很长时间!这就是为什么任何理智的人都会使用内置语言工具解析和验证它。

打破正则表达式的法则

我们将使用PHP生成正则表达式:

2013-01-01

上述代码将生成一个正则表达式,可以2013-03-01形式验证x =< yx-y之间$string = '20130101-20130101 20130201-20130101 20130105-20130120 20130201-20130301 20130210-20130215 20130301-20130301 20130301-20130201 '; // A sample $regex = file_get_contents('regex.txt'); // Get the regex from a file (which we generated previously) preg_match_all('#'.$regex.'#', $string, $matches); // Let's regex ! print_r($matches[0]); // Printing the matches ... 的日期。此正则表达式优化,大约 17KB 。如果我将其配置为验证10年的范围,那么想象一下这个正则表达式的大小?请注意,大小呈指数级增长。我尝试了4个月的间隔,但我得到一个错误/警告,说表达式太长了 由于正则表达式太长,我无法进行在线演示,但这里是PHP中的代码:

Array
(
    [0] => 20130101-20130101
    [1] => 20130105-20130120
    [2] => 20130201-20130301
    [3] => 20130210-20130215
    [4] => 20130301-20130301
)

<强>输出:

{{1}}

Online dump of the regex | Online PHP demo

结论

请不要考虑使用正则表达式执行此任务,否则您将遇到10个问题:)

答案 1 :(得分:0)

您可以将BizTalk Business Rules Engine Pipeline Framework与BRE政策结合使用来验证日期范围,而不是编写自己的自定义组件来进行验证。

完全披露:此框架由我的同事撰写。