是否有免费的代码"如何让SOLR / LUCENE(或类似的东西)指向一组word文档,以便用户快速搜索它们?
我正在进行原型设计,看看是否有价值,一个搜索一些本土新闻文章的系统。在我站起来处理搜索字符串输入和文档索引之前,我想在我开始尝试全部解决之前看看它是否值得。
谢谢,
贾德
答案 0 :(得分:1)
使用Solr的bin/post
工具和Tika处理程序(名为ExtractingRequestHandler),您应该可以快速启动并运行原型以进行原型设计。
参见Uploading Data with Solr Cell using Apache Tika的介绍。 Tika用于处理各种不同的文档类型。
您可以give the Solr post tool a directory or a list of files提交索引。
自动检测文件夹中的内容类型,并以递归方式扫描文档,以便将索引编入已启动的内容。
bin/post -c gettingstarted afolder/