正则表达式匹配多个字符串类型以搜索HS代码

时间:2016-06-09 10:59:59

标签: regex

我试图找到模式来检测我正在解析的某些文件的某些HS代码。

我可以找到包含HS代码的三种字符串。

  1. 1 AUTOMATION BYTRANSEXTENDED 4020.HS-CODE: 8428.9000
    我想在HS-CODE:(8428.9000)

  2. 之后提取所有内容
  3. RECONDHS CODE 84669400AMS REF CHS220928SCAC SSLL
    我想在HS CODE之后获取所有内容,直到新的非数字号码到达(84669400)

  4. ============H.S.CODE: 8466.93
    这就像第一个,在H.S CODE:之后得到所有内容(8466.93)

  5. 模式HS-CODE:\s+\K\S+适用于第一种类型,也适用于第三种类型(H.S.CODE: \s+\K\S+)。 您可以在此处进行测试:https://regex101.com/r/iZ9lO1/1

    我想知道如何组合模式以匹配上述三种类型中的任何一种。

    提前致谢。

1 个答案:

答案 0 :(得分:1)

您可以使用此正则表达式来满足问题中指定的所有三个要求:

H\.?S[.\s-]CODE[:\s]+\K[\d.]+

Updated RegEx Demo

这与您尝试的正则表达式非常相似,并且在HS以及CODE段周围进行了一些可选匹配。