谷歌学者Captcha验证问题

时间:2011-05-30 20:47:52

标签: captcha verification google-scholar

我正在开发一个项目,我需要从Google学术搜索中提取一些数据。我的PHP程序从我的本地机器获取一个字符串,将其传递给Google学术搜索,然后在搜索结果页面上取出第一个结果并将其保存到数据库中。

我必须为近9万个字符串/查询执行此操作。问题是,在几百个条目之后程序停止,因为Google学术搜索要求验证码验证。我该怎么办?

1 个答案:

答案 0 :(得分:2)

由于Google学术搜索没有API,因此没有记录的方法可以执行您想要的操作。您不应该像这样刮取数据,这就是您遇到Google的机器人保护功能的原因。我认为您唯一真正的选择是等待Google创建API。