解析潜在的ProductId

时间:2012-07-25 16:15:49

标签: c# .net regex parsing

我需要能够确定表单上文本字段中的特定文本是否为ProductId。

我想(遗憾的是)我可能需要正则表达式。

无论如何,搜索查询中可能存在任意数量的内容,我需要确定该字段内某些内容的可能性是否为产品。

我们所有的产品ID都具有以下格式:

  

AA8678NY

     

ONO23476

     

OPI765.0987

似乎没有任何通用格式(数据库中有超过400,000个产品ID)。

所以基本上,我想我想说的是,任何产品ID都可以被认为是starting with either 1 or more numbers, or letters, followed by either 1 dot or 1 or more numbers or letters, and ending with either 1 or more letters or numbers. - 有时它只是一堆数字。

我们可以在没有正则表达式的情况下实现这样的东西吗?

任何帮助都表示赞赏。

2 个答案:

答案 0 :(得分:3)

你可以,但为什么会这样? 正则表达式实际上非常简单:

[A-Z1-9]+|([A-Z1-9]+\.[A-Z1-9]+)

如果已知最小长度,请将+替换为{n,}

答案 1 :(得分:1)

正则表达式是一种非常简单的方法。我不确定你为什么这么不愿意使用它。这种模式应该适合你:

Regex productIDPattern = new Regex(@"[A-Z0-9]+\.*[A-Z0-9]+");