想象一下,我有一个产品清单,例如:
我正在尝试仅提取产品代码。
这将是一个连续文本的大块。它可能包含带有_ - 的A-Z 1-9。它始终是大写的。它总是以空间结束。它的长度未知。它可能只是数字。它始终是字符串中最大的连续块。
我的正则表达能力很弱,是否有可能用正则表达式提取?有更好的方法吗?
由于
答案 0 :(得分:2)
你可以试试这个
(?<!\S)[A-Z0-9-]{5,}(?!\S)
https://regex101.com/r/zHE8nc/2
(?<! \S ) # Whitespace boundary
[A-Z0-9-]{5,} # Allowed characters, minimum 5
(?! \S ) # Whitespace boundary