我正在开发社交媒体监控应用程序。目前,我们正在将Facebook页面ID输入到应用程序中以从可能的客户的Facebook墙收集数据(因此我们为客户提供了直接促销的实际样本)。 这些页面ID用于收集墙贴子和评论以及计算统计数据(例如显示最常用的单词),并在特殊视图中呈现给用户。要求是在近实时时间内收集所有帖子和评论。我们目前在系统中有大约130个页面ID,还有更多内容。
目前,我正在使用图谱API ,但有几个缺点:
FB API访问限制为600个请求/ 10分钟。要获得近乎实时的视图,我需要至少每两个小时访问一次API。由于我们在程序的其他部分也使用API请求,很明显迟早会触及限制(实际上,这种情况已经发生)
回复多数是多余的:要接收当前评论,我必须使用网址http://graph.facebook.com/NAME/feed请求留言贴(评论附在帖子中)...
达到限制的概率取决于几面墙上的贴子数量
我无法使用此方法获取所有条评论(例如前段时间对帖子的评论)
我目前正在尝试通过查询stream
和comment
表格来使用 FQL 切换到(或补充图谱API用法),但这也有局限性:
我无法将查询限制在特定的时间范围内,导致再次出现冗余
我为130个页面ID中的每一个获得的最大帖子数为61 - (为什么是61?)
我需要一些不可预测的额外请求,因为我需要在单独的请求中获取视频和链接等特殊对象。
我的问题现在是 - 如果有人在做类似的事情:你是如何解决这些问题的?你如何获得一个更大数量(最多,比如1000)的墙壁的伪实况流?
让客户向我们授予额外权限目前不是一种选择。
答案 0 :(得分:1)
您可能需要与FaceBook会面并制定合同协议,以便更好地访问其数据。我敢打赌,答案将是no,no和no,因为看起来你正试图通过他们的数据获利,而且,如果没有得到用户的明确许可,这样做,但是嘿,不要试一试。
答案 1 :(得分:0)
我有一个类似的任务 - 默认情况下FB在FQL中仅返回最后约50个帖子或全部返回30天(以较小者为准),您应该使用created_time
过滤器来获得更多结果。我目前的问题是,即使LIMIT
增加,通过FQL,我从任何FB页面墙收到的帖子不超过500篇:
'select post_id from stream where source_id = 40796308305 and created_time <'.time().' LIMIT 1000000 ;'
这个对CocaCola FB页面的FQL请求现在仅返回约300个帖子(不到2天的帖子)。
如果您找到更好的解决方案,请告知:)