为什么雅虎电影会返回“未知问题”页面?

时间:2011-11-30 00:50:18

标签: java request screen-scraping limit yahoo

据我所知雅虎电影没有API,我为它制作了一个刮刀(Java)。 现在的问题是,当我向雅虎电影请求几个页面时,它有时会返回“未知问题”页面,所以我决定重新请求该页面,直到它显示包含信息的页面为止我想要,但有时我必须重新请求20次,40次,120次,400次,所以这不好:(。 我很确定我正在请求正确的网址。 这是一个示例url

http://movies.yahoo.com/mvc/dfrv?mid=1810159162&uid=vdpL427zgsScLbwOEsyG4zOn1bQex.F2Xg--&s=&i=0&spl=0

所以我经历了它的分页。

有人知道为什么会这样吗?是雅虎限制吗?

另外,您是否了解其他来源或API以获取电影评论? (除了IMDB)

由于

1 个答案:

答案 0 :(得分:2)

首先,检查他们的服务条款是否可以接受。他们可能不会欣赏他们的网站被刮掉。

其次,我认为他们会限制你的联系。而不是再试一次,直到它工作,我会自己扼杀它。考虑Thread.sleep(500)。 (调整数字,以免出现错误。)如果您一直显示为受限制,他们可能只会阻止您的IP。