我有一个很大的URL列表,每个URL都有一个唯一的数字字符串,该字符串介于/
和?
之间,我想从notepad ++中删除所有其他不属于这些的文本字符串。例如
www.website.com/dsw/fv3n24nv1e4121v/123456789012?fwe=32432fdwe23f3
最终只能是123456789012
我已经知道以下正则表达式\b\d{12}\b
将使我得到12位数字,现在我只需要除去掉落在每一面的所有信息即可。我看了一眼,发现一些建议用\t$1
,$1\n
代替的帖子
,$1
和/1
,但是所有这些都与我想要的完全相反,只是删除了12位数字的字符串。
答案 0 :(得分:1)
您可以使用此正则表达式并将其替换为空字符串,
^[^ ]*\/|\?[^ ]*$
说明:
^[^ ]*\/
->匹配从字符串开头到找到/
\?[^ ]*$
->同样,它匹配从?
到输入结束的所有空格。答案 1 :(得分:0)
^.*/([^?]+).*$
$1
. matches newline
说明:
^ # beginning of line
.* # 0 or more any character but newline
/ # a slash
([^?\r\n]+) # group 1, 1 or more any character that is not ? or line break
.* # 0 or more any character but newline
$ # end of line
给定示例的结果
123456789012