用于25000-50000个条目的Web搜索API

时间:2010-01-26 02:03:35

标签: java api search-engine

我在excel文件中有20000-50000个条目。一列包含该公司的名称。理想情况下,我想搜索该公司的名称,无论第一个结果是什么,我都会选择与之关联的URL。我知道Google(我的理想选择)提供了一个AJAX Search API。但是,每个注册人还有1000个搜索限制。有没有办法获得超过20000次搜索而无需使用Google创建20个帐户,或者是否有可以使用的替代引擎?

也欢迎任何解决此问题的替代方法(即WhoIs查询)。

2 个答案:

答案 0 :(得分:3)

谷歌AJAX搜索没有1000的限制。雅虎搜索确实如此。 Google AJAX搜索限制您每次搜索获得64个结果,但没有限制。

来自Google AJAX Search API - Class Reference

  

注意:最大结果数   页面是基于的类型   搜索。本地搜索支持4   页面(或最多32个   结果)和其他搜索者   (博客,书籍,图片,新闻,专利,   视频和Web)支持8页(对于   最多总共64个结果)。

答案 1 :(得分:1)

避免使用外部搜索服务的方法......

方法1 - 将XML的信息内容放入数据库并使用SQL / JDBC进行搜索。使用Hibernate等的变体

方法2 - 将XML文件作为内存数据结构读取为Java集合,并以编程方式进行搜索。这将使用一些内存,具体取决于XML文件中的信息量,但您只需要弄清楚如何解析/加载XML并访问集合。

但是,如果您解释了尝试执行此操作的上下文,则会有所帮助。它是一个浏览器插件吗? Web应用程序的客户端?服务器端?桌面应用程序?