我需要将solr数据导出为EXCEL或CSV。 我有数百万条记录的SOLR代码,我需要一种方法将它们通过某个查询导出到CSV / EXCEL。另外我需要控制EXCEL中的标题。
你有什么建议? 是否有第三方API可以做到这一点? 我应该使用CSV格式并只提取它们然后操纵csv吗?
答案 0 :(得分:2)
导出Solr数据的最佳工具是/ export请求处理程序[1]。
不幸的是,从官方的Solr文档中,不支持csv作为输出。
Json是默认值。 如果您可以管理Json转换以获取CSV中所需的数据格式,则/ export绝对是最佳的继续方式。 如果性能不是问题,使用CSV响应编写器的标准选择请求处理程序应该执行技巧[2]。
http:/localhost:8983/solr/collection1/select?q=*:*&wt=csv&indent=true&rows=N
[1] https://lucene.apache.org/solr/guide/6_6/exporting-result-sets.html
[2] http:/ localhost:8886 / solr / tech / select?q = :& wt = csv& indent = true
答案 1 :(得分:1)
您可以使用Solr select
端点来提取包含q=*:*
和csv responseWriter
的所有文档。
Example:
http:/localhost:8886/solr/tech/select?q=*:*&wt=csv&indent=true
可以找到有关csv ResponseWriter的更多详细信息here。
答案 2 :(得分:0)
从Solr 6.3开始,您可以使用XLSX响应编写器。
通过这种方式,您可以控制结果标题,自定义您自己的列名称甚至列宽。它看起来正是你想要的:))
以下是您需要遵循的文档:https://lucene.apache.org/solr/guide/6_6/response-writers.html#ResponseWriters-XLSXResponseWriter