开源蜘蛛从网页获取链接,最快的方法是什么?

时间:2012-10-15 12:39:47

标签: c++ web-crawler

我需要抓取网页并仅从网页中提取链接。链接可以 亲戚,如:

...\blah\foo.html

最快的方法是什么?

  1. 获取网页
  2. 从任何表单中提取链接
  3. 更新:

    也许我需要的是htmlparser

0 个答案:

没有答案