从任何文件内容中提取/解析所有子域和域

时间:2018-11-06 07:22:02

标签: linux bash terminal subdomain

我想知道如何从任何文件内容中提取所有有效的子域和域。许多网站可以在线extract domains from any text。但我想知道如何在使用Linux机器的终端上执行此操作。

使用grep,我可以使用以下正则表达式执行此操作:(?:[a-z0-9](?:[a-z0-9-]{0,61}[a-z0-9])?\.)+[a-z0-9][a-z0-9-]{0,61}[a-z0-9]

示例:

echo  "extract example.com and a.example.cloud. from all content " | grep -oP  "(?:[a-z0-9](?:[a-z0-9-]{0,61}[a-z0-9])?\.)+[a-z0-9][a-z0-9-]{0,61}[a-z0-9]"

还有其他方法吗?

0 个答案:

没有答案