抓取网页内容

时间:2009-11-25 22:58:31

标签: screen-scraping

我刚开始研究这个问题,我想将我的Netgear路由器(http://192.168.0.1/setup.cgi?next_file=stattbl.htm)统计信息写入csv文件。

我跑赢了& Linux,但主要了解C ++,任何链接/解决方案?

2 个答案:

答案 0 :(得分:2)

正如MYYN建议的那样,像BeautifulSoupHpricot这样的东西在这类事情上真的很擅长,所以如果你不完全相信它必须在C ++中,你真的应该研究那些(python和ruby的基础知识可以很快得到,并且肯定比C ++简单得多)。或者,请查看QTDOMDocumentTinyXML++

答案 1 :(得分:1)

我知道并编写了c ++,但是对于屏幕抓取,我宁愿使用像python这样的脚本语言和一些方便的库,例如: http://www.crummy.com/software/BeautifulSoup/

特别是在Linux上,python应该已经安装(或者至少可以通过包管理器轻松安装)。