索引并搜索我需要的文件

时间:2014-01-23 04:31:06

标签: solr

假设我有一个包含CV的信息的pdf文件 -

名称:xyz DOB:1980年11月11日 电子邮件:xyz@yzx.com

目标:xyz abc ....

技能:c ++ c java xml等

教育: 大学名称大学 结果:9

工作经验/技术活动/实习:xyz abc def ...

活动/兴趣/体育:abc ..

参考:xyz 宣言:我在这里......


我想在solr中索引类似的pdf文件。我是新来的。 所以任何人都可以坚持我到底需要做什么。 如何索引。我只知道我必须使用curl命令。但我不知道我必须在schma.xml和solrconfig.xml中进行更改或添加,以索引此文件并查询一些确切的内容。

我想做一些任务,例如查找以java为技能的人的姓名。 我只需要将他们的名字和技能显示为结果。

请帮帮我。提前致谢

1 个答案:

答案 0 :(得分:0)

在Solr中,您将数据存储为Solr文档。每个文档都包含 id 和多个字段。对于每个字段,您可以存储数据。

  1. Read here并设计自定义架构。您应该拥有要查询的所有字段。
  2. 将您的数据编入索尔。以下2个URL将指导您如何索引数据和提取文档。 http://wiki.apache.org/solr/UpdateXmlMessages http://wiki.apache.org/solr/ExtractingRequestHandler
  3. 最后query
  4. 希望这些能够指导你。