我想知道如何从任何文件内容中提取所有有效的子域和域。许多网站可以在线extract domains from any text。但我想知道如何在使用Linux机器的终端上执行此操作。
使用grep,我可以使用以下正则表达式执行此操作:(?:[a-z0-9](?:[a-z0-9-]{0,61}[a-z0-9])?\.)+[a-z0-9][a-z0-9-]{0,61}[a-z0-9]
示例:
echo "extract example.com and a.example.cloud. from all content " | grep -oP "(?:[a-z0-9](?:[a-z0-9-]{0,61}[a-z0-9])?\.)+[a-z0-9][a-z0-9-]{0,61}[a-z0-9]"
还有其他方法吗?