我非常清楚这个话题已经过深入讨论(我整天都在阅读很多内容)。
但是,FB可能允许我为非商业性非公立研究型大学项目创建一个前端爬虫是多么可能?
我的抓取工具应反复查找数量非常有限的公共粉丝页面,并收集匿名数据,如粉丝数量,状态更新及其喜欢的数量和评论数量。
我想展示的是媒体页面中的哪些主题被“喜欢”和讨论最多,以及如何随着时间的推移而发展。我知道FB的限制性服务条款。感谢您对此的看法。
第二个问题涉及技术方法/授权:阅读粉丝页面的粉丝数量,状态更新及其各自的喜欢数量 - 我是否可以将API / OpenGraph用于此类抓取工具?我认为,对于阅读页面墙,您需要不惜任何代价访问令牌,因此我无法通过应用程序实现自动“爬虫”(因为应用程序只对用户的操作作出反应,并且不能像cron作业那样行事) ?
如您所见,我对FB开发和逻辑很新。非常感谢您的专业知识。
答案 0 :(得分:0)
如果您主要定位公共页面,那么您应该没问题。
你需要有一个Facebook应用程序,然后你可以从你的程序中authenticate as the app。 您将获得一个应用程序令牌,您可以使用该令牌来抓取公共页面数据。
如果您查看表格(字段和连接)中显示的Page object文档,权限列中的大部分内容都是“无访问令牌或用户access_token“或”任何有效的access_token或用户access_token“,如果您有应用令牌,那就很好。
另外,我认为这是你会感兴趣的,Page对象有“talking_about_count”字段。
所以,是的,你可以做到,至少大部分是这样的。 至于服务条款,因为所有这些都完全可以直接来自他们的官方文档,所以没有问题。