我在excel文件中有20000-50000个条目。一列包含该公司的名称。理想情况下,我想搜索该公司的名称,无论第一个结果是什么,我都会选择与之关联的URL。我知道Google(我的理想选择)提供了一个AJAX Search API。但是,每个注册人还有1000个搜索限制。有没有办法获得超过20000次搜索而无需使用Google创建20个帐户,或者是否有可以使用的替代引擎?
也欢迎任何解决此问题的替代方法(即WhoIs查询)。
答案 0 :(得分:3)
谷歌AJAX搜索没有1000的限制。雅虎搜索确实如此。 Google AJAX搜索限制您每次搜索获得64个结果,但没有限制。
来自Google AJAX Search API - Class Reference:
注意:最大结果数 页面是基于的类型 搜索。本地搜索支持4 页面(或最多32个 结果)和其他搜索者 (博客,书籍,图片,新闻,专利, 视频和Web)支持8页(对于 最多总共64个结果)。
答案 1 :(得分:1)
避免使用外部搜索服务的方法......
方法1 - 将XML的信息内容放入数据库并使用SQL / JDBC进行搜索。使用Hibernate等的变体
方法2 - 将XML文件作为内存数据结构读取为Java集合,并以编程方式进行搜索。这将使用一些内存,具体取决于XML文件中的信息量,但您只需要弄清楚如何解析/加载XML并访问集合。
但是,如果您解释了尝试执行此操作的上下文,则会有所帮助。它是一个浏览器插件吗? Web应用程序的客户端?服务器端?桌面应用程序?