Solr长期存储或导出功能

时间:2012-12-26 11:18:06

标签: solr storage

我们的Solr应用程序每天向Solr索引添加大约1 GiB的数据。应用程序仅访问最近N天的数据,但必须保存所有数据以供将来使用。为了节省主服务器上的空间(昂贵),我想导出数据并将其保存在本地存储(便宜)上。 MySQL具有出色的mysqldump功能,可根据需要轻松导出和导入数据。 Solr是否具有可以在不关闭Solr应用程序的情况下激活的类似功能?

我感兴趣的具体关键功能:

  1. 在Solr运行时工作,没有停机时间。

  2. 导出数据子集,例如datetime:[1356220800 TO 1356393600]

  3. 导入数据

  4. 我感兴趣的具体非关键功能:

    1. 能够搜索导出的数据以查找要插入的子集(使用常见的GNU工具,例如grep或小型独立工具。

    2. 内在数据压缩。

1 个答案:

答案 0 :(得分:3)

您可以查看: -

  • Solr backup - 允许您备份同一服务器上的索引。您可以重复使用索引,因为它是一个完整的Solr索引
  • Replication - 您可以定期复制每个并在不同的Solr服务器上维护索引。这基本上是导出和导入,因为它需要Solr运行并且将托管供您使用。
  • 您始终可以使用Delete查询删除Solr中的数据(日期之前的所有记录)。

另外

  • 没有时间特定的导出或转储功能。但是,你 可以每天,每周执行上述操作,您将只拥有数据 在那段时间内。
  • 以上所有内容都可以在Solr上运行 停机时间。
  • 索引可以与其他Solr实例查询或Luke