我有一个文本文件。首先,我该如何索引它?文件中还有一些特定的术语,我也希望对这些文件进行解析,即如果我索引一个TEXT文件,其内容按原样保存,是否由solr解析?
如果没有paresed(对于文本文件中的一些独特术语),那我该怎么办呢。 我已经知道通过使用脚本post.sh,你可以索引它,但它只适用于xml文件,而不适用于文本文件!
答案 0 :(得分:0)
这不是技术问题。您需要退后一步,问问自己找到的目标。一个文件是对应一个结果还是对应多个结果。如果很多,那么什么是结果。
然后,您必须查看文件的来源。您是将它们推入Solr还是让Solr将它们(从数据库或文件系统中)拉出来。
这为您提供了一种方法来弄清楚如何提出更好,更具体的问题。例如,要以拉式方式逐行读取文件,您可能需要查看带有FileDataSource和LineEntityProcessor的DataImportHandler。