有没有办法抓取所有Facebook粉丝页面?

时间:2010-04-02 05:23:38

标签: php facebook web-crawler

有没有办法抓取所有Facebook粉丝页面并收集一些信息?例如抓取Facebook粉丝页面并保存他们的名字,或者有多少粉丝等? 或者至少,你是否暗示如何做到这一点?

3 个答案:

答案 0 :(得分:2)

编写一个抓取工具。

答案 1 :(得分:1)

首先选择包含所需页面类别的页面:

例如: http://www.facebook.com/pages/http://www.facebook.com/pages/?browse&ps=93

然后使用抓取工具获取所有网页链接。

现在,您可以使用提取的链接分别解析每个页面。

您可以使用simple html dom进行抓取。

答案 2 :(得分:1)

下载并运行websphinx jar。输入http://www.facebook.com/pages/到起始网址,然后选择子树为抓取。不要忘记增加页面大小和页面超时值。较高数量(100-200)的线程有更高的成功抓取更多页面的机会。