应用错误收集

时间：2017-10-24 11:25:49

标签： facebook parsing twitter instagram social-networking

我专注于使用Python进行解析，目前正致力于社会学研究。在我的研究中，我需要从任何最流行的社交网络中解析最多的页面。我已经通过他们的API和其他方法来搜索这些并发现他们中的大多数（Facebook，Twitter，Instagram）不允许通过关注者计数或其他信息进行搜索。

有人有这个问题吗？你是怎么克服的？有没有办法解析我需要的东西（不仅仅是在上面提到的社交网站，不包括YouTube）？

UPD：出于研究目的，我需要数千个。

答案 0 :(得分：0)

管理以寻找Twitter的答案。不是很优雅，但这就是我所需要的。

如果您需要超过1k的某些博客（例如拥有1米或更多粉丝的博主），您可以使用以下算法：

我认为你明白了。在大多数情况下，热门页面主要是最受欢迎的页面，这就是它为什么会这样做的原因=）由于twitters` API每15分钟只给你15个请求，这取决于你需要的页数，这个工作需要一些时间（对我来说，花1小时才能获得1k页）