我在C ++中构建了一个webcrawler。我使用的是名为URLdownloadToFile()
的API。
URLdownloadToFile()
适用于某些网址,并且对其他一些网址效果不佳?请提出一些我可以解决这个问题的方法吗?谢谢, Dnyaneshwari C.
答案 0 :(得分:2)
您可能需要查看libcurl,它应该允许您使用各种协议提取内容。这也应该支持代理等,这可能会给你带来特定网址的问题。也可以看看; http://curl.haxx.se/
答案 1 :(得分:0)
答案 2 :(得分:0)
除非有特别的理由坚持使用c ++,否则最好切换到Python并使用BeautifulSoup。我使用过curl,这很好,但我的所有网页内容都是用Python完成的