应用错误收集

尝试了解AllRecipes.co.uk的robots.txt文件

时间：2018-12-26 13:56:16

标签： robots.txt

我将要从AllRecipes.co.uk抓取信息，我只是想在开始之前帮助您了解robots.txt文件。

我的目的是抓取食谱信息-ID，名称，平均等级，成分，服务，NumberOfReviews和方法

此外，我还将解析评论信息-评分，用户和用户ID

我只是想检查我是否仍然违反了robots.txt文件中的任何规则，因为我还是这个新手

import re
print re.findall("<seg>(.*?)</seg>", your input)

0 个答案:

没有答案