如何以编程方式查找从html引用的所有文件?

时间:2018-01-18 02:59:35

标签: html c++ file download libcurl

是否可以找到所有“href”和“src”属性,并检查它们的值是否包含"*/*.*"之类的内容? '/'应该是唯一的(不是“//”,因为它可以在协议之后的开始使用)。

我猜查询会更复杂,但我是否正在考虑朝着正确的方向前进?我需要用C ++编写它,我可能会使用libcurl,但我猜这些事实并不重要。

0 个答案:

没有答案