应用错误收集

时间：2016-07-03 22:47:04

标签： mysql web-crawler

标题几乎说明了一切，我正在追踪一个可以自动将其调查结果添加到数据库中的网络爬虫，这样的事情是存在还是我最好自己制作？

答案 0 :(得分：0)

您可以为此付出大量服务：https://www.quora.com/What-are-the-best-web-crawling-services但是，如果您正在寻找免费服务，那么您最好自己制作服务。

如果您选择DIY路线，请查看Firebase数据库：https://firebase.google.com/docs/database/ Firebase可以轻松创建数据库，设置规则，并通过简单的Web应用程序执行CRUD操作，而无需构建自定义后端。这听起来像是你所描述的小项目的完美候选者。

此外，如果您不熟悉webcrawler，请查看Scrapy。在我使用的所有抓取库中，这个是最简单的项目之一。

答案 1 :(得分：0)

StormCrawler有一个SQL模块，允许存储有关在表中发现的URL的信息。 Cloudsearch tutorial有点过时，但解释了如何将StormCrawler与MySQL结合使用。