以下是一个示例:http://www.t-mobile.com/cell-phones/samsung-galaxy-note-4.html
使用bazaarvoice / bv作为评论生成器。它也使用javascript / ajax加载不同的页面,所以我不能简单地下载1个html源文件。理想情况下,我希望每个评论信息都有一个大的html文件(解析或不关心)
有没有人有任何建议?我是这个网络抓取和新手的新手。屏幕抓取
答案 0 :(得分:0)
是的,实际上有一个github存储库。以下是该网站的链接:http://webscraper.io/。下载并与Chrome一起运行。观看视频。这是一个方便的工具。