假设一个像https://www.wood-database.com/wood-finder/这样的网站(我们的工作示例)。它的每一页都有有关木种的数据。假设我们需要按照木材数据的比率(例如硬度/重量)对木材进行分类,那么该站点的工具并不是很有用。
将有用的是将数据传递到excel中的表格,该表格可以轻松地计算比率和排序。
有哪些方法可以自动填写表格?除了excel以外,还有哪些其他工具可以做到?
答案 0 :(得分:0)
您应该看一下python,它非常适合这项工作。首先,您可以将请求库与beatifulsoup一起使用,然后将所有数据加载到Pandas Dataframe中,然后将其简单导出为excel(Pandas的标准功能)。
如果您确实要彻底刮取该网站,则可以考虑使用Scrapy(https://scrapy.org/)