我将实现一个图像搜索引擎,基本上目标是让用户通过文本查询在图像存储库中进行搜索。此外,我必须处理该项目的爬网部分。
我正在研究信息检索,并且对Lucene,Solr和Nutch有基本的了解。我必须使用的工具
所以我的问题在项目的这个阶段有点“抽象”:
我对数据集中的图像没有任何限制,我只需要大约1000个文件。第一种选择是只使用随机图像,但也许我可以做得更好(即在爬行时建立图像描述或类似的东西)
再次,我想我至少需要对每个图像进行描述,或者可能需要描述符列表...是否有任何服务可以基于图像动态构建图像?
一旦构建完成,由于我将拥有一个数据集和一个索引,但是其余工作应该是微不足道的,但是如果您有任何建议,请随时提出建议。