我试图找到模式来检测我正在解析的某些文件的某些HS代码。
我可以找到包含HS代码的三种字符串。
1 AUTOMATION BYTRANSEXTENDED 4020.HS-CODE: 8428.9000
我想在HS-CODE:
(8428.9000)
RECONDHS CODE 84669400AMS REF CHS220928SCAC SSLL
。
我想在HS CODE
之后获取所有内容,直到新的非数字号码到达(84669400)
============H.S.CODE: 8466.93
这就像第一个,在H.S CODE:
之后得到所有内容(8466.93)
模式HS-CODE:\s+\K\S+
适用于第一种类型,也适用于第三种类型(H.S.CODE: \s+\K\S+
)。
您可以在此处进行测试:https://regex101.com/r/iZ9lO1/1
我想知道如何组合模式以匹配上述三种类型中的任何一种。
提前致谢。
答案 0 :(得分:1)
您可以使用此正则表达式来满足问题中指定的所有三个要求:
H\.?S[.\s-]CODE[:\s]+\K[\d.]+
这与您尝试的正则表达式非常相似,并且在H
和S
以及CODE
段周围进行了一些可选匹配。