我们花了几天的时间研究FB Graph API和用于抓取FB数据的第三方工具,但是无法弄清楚是否有可能刮掉我们正在寻找的东西以及它是否属于FB政策(真的不期待与FB开始诉讼。
我们需要获得在Facebook上发布的特定问题(阅读 - 我们将尝试解决的问题)的频率统计。我们需要通过三个标准过滤所有FB帖子:
然后我们将获取此数据集并手动检查它以区分与我们相关的内容和不相关的内容。也许使用像wit.ai或api.ai这样的语言处理引擎来使用数据集教授应用程序来重新定义哪些帖子是相关的,哪些不相关。但那就是我们,后来。
所以问题:是否有可能(从技术上和FB政策的角度来看)以及通过上述三个标准过滤FB帖子的步骤是什么?