以编程方式从社交网络抓取用户文章

时间:2011-10-10 02:34:54

标签: facebook web-crawler social-networking web

是否有可能从Facebook等社交网络中以编程方式抓取用户信息? 我需要一些用户信息(更具体地说,发布的文章)来做一个小型数据挖掘项目。

我想我有以下问题。

  1. 如果我没有直接访问数据库的话,是否必须登录(比方说Facebook)才能检索信息。(所以我必须抓取它)
  2. 如果必须,我如何以编程方式登录我的帐户(如Facebook)?
  3. 他们的文章存储库是否可用?数据越多越好。

1 个答案:

答案 0 :(得分:1)

Facebook有一个允许您访问此信息的API。 API为开发人员提供了访问Facebook数据甚至执行操作的界面。您应该订阅您的应用程序,然后您将获得使用该API的密钥。

如果Facebook用户公开提供某些信息,您可以在不请求访问权限的情况下访问它,否则您将需要用户接受您的申请以使用他的私人信息。

以下是使用Facebook进行任何开发的主要链接: https://developers.facebook.com/

以下是API的主要链接: https://developers.facebook.com/docs/reference/api/

这个入门应该是有用的: https://developers.facebook.com/docs/beta/opengraph/tutorial/