我正在尝试了解网络报废工具。
所以如果有人帮助我开始它,一些教程链接可能有所帮助。
1)何时应该进行网络报废
2)rss feed有什么好处?
3)网络报废市场上最好的工具
谢谢!
答案 0 :(得分:1)
简化要领:"这取决于你想要实现的目标。"
如果您有一个RSS提要,其中包含您需要的所有信息,则不需要抓取网页。
如果您尝试从不提供API直接访问数据的网站提取数据,您可以使用抓取以结构化方式从页面中提取所需信息。您可以将数据保存到数据库中并从那里开始工作。
例如:在早期的Web 2.0时代,有些网站会抓取所有其他" flight" -pages来为特定的来源和目的地提取最便宜的航班。