你知道现有的facebook解析器不使用facebook api吗?我问,因为我想下载所有朋友和我的照片,但facebook会阻止应用程序api键这样做(我在python中为我的私人目的创建应用程序只做那个并使用fb api而现在facebook不想回复有效密钥)。使用伪造用户代理并且不使用api的解析器将不那么透明。
答案 0 :(得分:0)
您可以尝试使用类似TagSoup的内容解析Facebook生成的HTML(有许多语言的端口,也可能是您正在使用的语言)。但是我想说明这里的真正问题可能不是技术问题,而是政治问题(但我对FB API不够熟悉,以确保这一点):
Facebook并不希望从你的服务器中获取这些东西,而且他们可能会有一些成功的实施。例如,他们可能会不时地使用一些验证码来阻止您的爬虫。或阻止从您的IP访问。或者诸如此类的。当你开始这样做时,你会爬上某种升级阶梯。