我想创建一个爬虫程序,可以抓取Facebook事件中列出的所有事件。我有一个facebook链接,我可以访问所有页面。 我只是想知道,当我使用正则表达式(后来我将使用DOM)抓取任何特定的事件页面时,我的抓取工具从其主页(登录页面)获取数据。 如何访问所有Facebook活动页面?
我大致写了这段代码来获取页面标题:/<title.+?>(.+)<\/title>/
。它给出了输出:“更新您的浏览器| Facebook”
我认为使用Facebook的FQL是一种更好的方式来连接Facebook并提取数据。任何人都可以让我知道使用FQL和SDK的过程吗?
提前致谢!