Rightmove API和抓取技术和法律

时间:2016-04-16 09:39:47

标签: api screen-scraping

我正在寻找使用属性数据构建应用程序。 Nestoria有一个免费的API和使用规则,Zoopla是您注册的API。 OnTheMarket和Rightmove对这封信有相同的使用条款(竞争对手奇怪吗?)。 Rightmove宣传API上传但不下载 - 我找不到OnTheMarket的任何内容。

我发现Rightmove确实有一个API,虽然邮政编码搜索被他们自己的outcode映射混淆了......

https://api.rightmove.co.uk/api/sale/find?index=0&sortType=1&numberOfPropertiesRequested=2&locationIdentifier=OUTCODE%5E1&apiApplication=IPAD

我担心使用未提升的API。另一种方法是抓取,这在技术上和法律上都比较难以解决,尽管从我读到的数据是在公共领域并且可以免费使用。

我已经联系了Rightmove但没有得到回应。

是否有人使用Rightmove api并获得了他们的授权?似乎最奇怪的是它是开放的和可用的,但在搜索时几乎没有提及。

任何人都可以澄清有哪些规则/法律/道德规范来抓取数据吗?

2 个答案:

答案 0 :(得分:10)

不要查询其隐藏的API。但是你可以在RightMove.co.uk网站上运行一个网络爬虫,它完全合法,如第3.3节Terms of Service中所述:

  

您不得使用或尝试使用任何自动程序,除非自动程序在用户代理字段中唯一标识自己并且完全符合机器人排除协议

像Apache Nutch这样的网络爬虫完全遵循机器人排除协议。从their robots.txt file我发现他们有精心设计的嵌套sitemap.xml文件,因此他们宁愿推广他们网站的有组织但礼貌的抓取。我本人想要获取他们的数据,所以我开始尝试用我的资源抓取他们 - 如果你需要访问这些数据,请告诉我。

答案 1 :(得分:0)

不允许您抓取他们的数据,以下是他们的条款和条件:

”“您不得使用或尝试使用任何自动化程序(包括但不限于任何蜘蛛或其他网络爬虫)来访问我们的系统或本网站。您不得在本网站上使用任何抓取技术。任何此类使用或试图使用自动化程序将构成对我们系统和本网站的滥用。严格禁止通过任何此类自动化程序访问我们系统或本网站的任何部分。”