标签: text hyperlink extract
我有一个很大的.htm文件(106 MB)。文件包含许多链接(99%的内容)。
我只需要获取那些在url中包含指定字符串的短语。
这样做有什么简单的方法?这可以通过以HTML格式或文本格式提取链接。