DQS-正则表达式可检测无效的国家/地区名称

时间:2019-06-19 17:20:53

标签: sql-server regex data-quality-services

我正在创建域规则,以避免我的国家/地区域中的值不对应于国家/地区的长名称/两个字母的代码/三个字母的代码/数字和本地标题。

能否请您帮我创建一条规则,以捕获诸如hiraganas和阿拉伯字母的本地字符?

这是我的域值的样子

enter image description here

我正在尝试捕获类似值

  • البحرين(巴林)
  • বাংলাদেশ(孟加拉国)
  • កម្ពុជា(柬埔寨)
  • 阿拉伯联合酋长国(الإماراتالعربيةالمتحدة)

这是我到目前为止的进步

enter image description here

此外,我想知道DQS用于正则表达式的方言是什么。

2 个答案:

答案 0 :(得分:1)

您可以创建一个与多个替代项匹配的正则表达式,其基本形式如下:

^(A|B|C|D)$

其中ABCD代表您允许的模式,例如[0-9]{3},依此类推。阅读:https://www.regular-expressions.info/alternation.html

这样,您只需要一个(尽管更长)正则表达式,这可能在UI中更容易处理,并且DQS只需要根据一个表达式检查输入值,这对性能会更好。

答案 1 :(得分:1)

也许您可以在正则表达式上使用Unicode类别。在此处检查操作方法:

https://www.regular-expressions.info/unicode.html