导入全文然后拆分为截断和关键字形式

时间:2012-09-17 14:08:46

标签: search solr lucene

我已经打了一堵墙,并希望得到一些指导。我想索引一大块文本,如:

  

有几名男子正在高尔夫俱乐部的更衣室里。手机上的手机   工作台环和男人参与免提扬声器功能和   开始说话。房间里的其他人都停下来听。男人   挂了。更衣室里的其他男人正在看着他   惊讶。然后他微笑着问:“任何人都知道谁的电话   是??? !!!“

我不想存储这个全文,因为它在Solr 中,我想要它有两个版本。一个是截断形式,一个是关键字形式。

截断表格

  

有几名男子正在高尔夫俱乐部的更衣室里。手机上的手机   工作台环和男人参与免提扬声器功能和   开始说话。其他人......

关键字表单(使用停用词删除常用字词):

  

几名男子更衣室高尔夫俱乐部手机长凳男子参与   免提扬声器功能开始说话其他人的房间停止   听着男人挂起其他男人的更衣室,看着他惊讶   微笑问任何人都知道谁的电话

我该怎么做呢

1 个答案:

答案 0 :(得分:1)

只需在客户端执行这些转换,然后在每个版本的Solr中都有两个字段。