我已经打了一堵墙,并希望得到一些指导。我想索引一大块文本,如:
有几名男子正在高尔夫俱乐部的更衣室里。手机上的手机 工作台环和男人参与免提扬声器功能和 开始说话。房间里的其他人都停下来听。男人 挂了。更衣室里的其他男人正在看着他 惊讶。然后他微笑着问:“任何人都知道谁的电话 是??? !!!“
我不想存储这个全文,因为它在Solr 中,我想要它有两个版本。一个是截断形式,一个是关键字形式。
截断表格
有几名男子正在高尔夫俱乐部的更衣室里。手机上的手机 工作台环和男人参与免提扬声器功能和 开始说话。其他人......
关键字表单(使用停用词删除常用字词):
几名男子更衣室高尔夫俱乐部手机长凳男子参与 免提扬声器功能开始说话其他人的房间停止 听着男人挂起其他男人的更衣室,看着他惊讶 微笑问任何人都知道谁的电话
我该怎么做呢
答案 0 :(得分:1)
只需在客户端执行这些转换,然后在每个版本的Solr中都有两个字段。