我有一个包含许多网址的文本文档。 URls有许多不同的结局,如.net,.com,.de等......所有的URL都没有http:// oder www。在前。文档中还有许多其他文本,它看起来像这样:
2014/05/03 Red V!per M R United States jsugarcia.com/viper.gif Linux mirror
2014/05/03 Red V!per M R United States thepeoplecenter.org/viper.gif Linux mirror
2014/05/03 Red V!per R Netherlands ghijbeek.nl/viper.gif Linux mirror
2014/05/03 Red V!per M R Netherlands straalbedrijfsanders.nl/viper.gif Linux mirror
2014/05/03 Red V!per R European Union serialnastya.com/viper.gif Linux mirror
2014/05/03 Red V!per M R Denmark thueringer-treppenlifte.de/vip... Linux mirror
2014/05/03 Red V!per R United States tapitwater.com/images/viper.gif Linux mirror
2014/05/03 Red V!per R Norway sekureco.no/viper.gif Linux mirror
我想现在在Notepad ++中进行过滤,这样我只有带有这样的linebrak的网址:
site.com
答案 0 :(得分:5)
似乎所有行都以Linux mirror
终止,如果总是如此,你可以这样做:
^.+\s+([^\s/]+)\S+\s+Linux\s+mirror
$1
<强>解释强>
^ : begining of line
.+ : 1 or more any character
\s+ : 1 or more space
( : start group 1
[^\s/]+ : 1 or more NON space or NON slash (The domain)
) : end group 1
\S+ : 1 or more NON space
\s+ : 1 or more space
Linux : literally Linux
\s+ : 1 or more space
mirror : literally mirror
给定示例的结果:
jsugarcia.com
thepeoplecenter.org
ghijbeek.nl
straalbedrijfsanders.nl
serialnastya.com
thueringer-treppenlifte.de
tapitwater.com
sekureco.no
答案 1 :(得分:1)
Ctrl+F
打开搜索框Regular Expression
.*(\b\w+\.com).*
Find All in Current Document
您可以测试您想要的正则表达式:https://regex101.com/r/0o2IsM/3