RegEx用于解析IUPAC化学式

时间:2017-07-10 16:34:43

标签: regex

我需要在文本中匹配以IUPAC形式编写的化学公式。这里有一个例子:

发现 N-(5-氟吡啶-2-基)-6-甲基-4-(嘧啶-5-基氧基)吡啶酰胺(VU0424238):一种新的代谢型谷氨酸负变构调节剂选择受体亚型5用于临床评估。

自己的公式总是这种风格:

2-氯-4- [1-(4-氟-3-甲基 - 苯基)-2-甲基-1H-咪唑-4-基乙炔基] - 吡啶

2-氯-4- [2- [1-(4-氟-3-甲基苯基)-2,5-二甲基咪唑-4-基]乙炔基]吡啶

2-氯-4- [2- [1-(4-氟-3-甲基苯基)-2-甲基咪唑-4-基]乙炔基]吡啶

2-氯-4- [2- [1-(3-氟-4-甲基苯基)-2-甲基咪唑-4-基]乙炔基]吡啶

N - [[1-(4-氯苯基)-2- [2-(4-氟苯基)乙基]咪唑-4-基]甲基] -N-甲基吡啶-4-胺

4- [2- [1-(5-氯吡啶-2-基)-2-甲基咪唑-4-基]乙炔基] -2-甲基吡啶

是否有正则表达式来找到这种公式?

谢谢, A. Helle

1 个答案:

答案 0 :(得分:0)

自己的公式始终采用这种样式

如果是这样,这个人可以解决问题

([A-z]|\d)-[A-z\d\(\)[\]\-,]+