关于this relatively old blogpost看到Cloudant's search feature。
正在寻找一些查询的答案,因为我们使用Cloudant Heroku Addon&需要支持搜索查询:
是否可以将基于Lucene的搜索索引存储在CouchDB本身中,这样如果我们复制数据库(比如移动设备上的Couchbase / CouchDB),那么索引数据也会随附它
索引是否可以在复制的CouchDB数据库上运行,或仅在Cloudant上运行?
如果我们将PDF作为附件存储在CouchDB文档中怎么办?是否支持索引和搜索这些开箱即用的字段?我们应该解析PDF的&编写我们自己的分析器然后导入Cloudant?
如果我们想支持搜索CouchDB的PDF“附件”内容,那么最好的方法是什么?这些附件会从Cloudant复制到移动设备上的本地CouchDB实例?
如果有人能通过Cloudant提供一些指示来实现这些目标,那将会很棒。
我知道有一些替代方案,例如CouchDB-Lucene提到here。
但由于我们使用Cloudant作为中心CouchDB,很想知道这是否可以轻松完成。
由于
答案 0 :(得分:3)
是否可以将基于Lucene的搜索索引存储在CouchDB本身中,这样如果我们复制数据库(比如移动设备上的Couchbase / CouchDB),那么索引数据也随之附带? / p>
Cloudant上的搜索索引始终存储在数据库之外。与查看数据一样,它们不会被复制。否则,我们无法使用Lucene高度优化的磁盘格式。
索引是否可以在复制的CouchDB数据库上运行,或仅在Cloudant上运行?
搜索索引仅适用于Cloudant(使用设计文档中的“索引”字段)。您需要为移动设备或复制的vanilla-CouchDB实例提供单独的解决方案。
如果我们将PDF作为附件存储在CouchDB文档中怎么办?是否支持索引和搜索这些开箱即用的字段?我们应该解析PDF的&编写我们自己的分析器然后导入Cloudant?
目前,您需要使用类似Tika的内容自行解析PDF中的文本,并将其存储在文档中的某个字段中,然后通过搜索对其进行索引。虽然支持索引二进制文件可能会在某个时刻到达,但不太可能支持自定义分析器。
如果我们想支持搜索CouchDB的PDF“附件”内容,那么最好的方法是什么?这些附件会从Cloudant复制到移动设备上的本地CouchDB实例?
这取决于平台。由于您已经解析了用于Cloudant搜索的PDF文本,因此您可以使用设备上的本地搜索API。不幸的是,这些在当地还有点薄,我还没有时间为自己尝试任何东西。令人遗憾的是,到目前为止,我还没有在iOS上提供SearchKit。
或者您可以使用Cloudant的搜索在线搜索,然后在您拥有文档ID的情况下从本地数据库中提取文档。