我在python-工作 出于好奇和要求,我问这个问题。我需要创建一个配方复印机/刮板,它可以在近20-25个网站上运行。我所知道的是使用python 2.7的beautifulsoup模块抓取一个网站,当你知道一个网站的结构时它有助于抓取数据。
但是有很多餐饮/食谱网站提供食谱剪刀/复印机,它们按照
运作还有更多。它们都提供从其他网站导入食谱的选项。他们是否创建了一个适用于大多数网站的自定义剪贴簿,或者是否存在他们正在使用的任何精彩API?
我找到了一个这样的定制刮刀: Recipe scraper
但是它是用Python 3构建的,不支持python 2所以它对我来说没什么用,但是当我查看代码时我才知道它正在使用漂亮的汤并编写自定义代码来废弃所有主要内容食谱网站。
任何人都可以帮助我理解我列出的所有网站以及更多创建食谱剪辑的方法吗?