Question

您好我有一个Facebook页面网址列表

eg...
http://www.facebook.com/daftpunk
http://www.facebook.com/DavidGuetta
...

最好的方法是：

非常感谢帮助。

Answer 1

无需抓取任何内容（无论如何都违反了Facebook的服务条款）：

有关您可以在同一通话中检索的其他数据，请参阅Page FQL table。

Answer 2

使用urllib2或pyfacebook获取内容

使用BeautifulSoup或lxml来解析它

使用re模块（正则表达式）为您的验证和数据收集提取内容

Answer 3

粉丝数量位于“FanManager”类的标签中。您可以使用Beautiful Soup获取此标记的内容，使用正则表达式将字符串中的数据（例如：1,000,000粉丝）作为int或任何您想要的内容获取。

要查看该网页是否存在，请检查一些标记，看看您是否在404页面上。

Answer 4

您可以使用scrapy或BeautifulSoup来抓取内容。