应用错误收集

轻松的方法继续失败的reindex？

时间：2016-09-06 14:27:45

标签： python elasticsearch

我目前正尝试使用Python API重新索引大量数据（约9600万份文档），特别是reindex命令。

运行命令时，我最终会从bulk命令获得超时错误。我已经尝试将bulk_kwargs request_timeout设置为24小时，但它仍然超时... 28小时后加载了5700万条记录。重新运行reindex只会删除现有的重新索引并重新开始。

无论错误发生的原因（我认为我遇到了可以解决的磁盘瓶颈问题。没有out of memory错误）是否有任何简单的方法可以继续重新索引从哪里去世？

1 个答案:

答案 0 :(得分：1)

如果您说您要删除现有的并重新开始，那么只需删除索引并创建新索引并将其输入。会更快。

或

如果您不能拥有空索引，则逐个或使用某些批量删除某些id标识的项目，并根据id进行更新。

相关问题

简单的方法来禁用UITextField？

翻译网站的简便方法

有没有更聪明的方法来重新索引弹性搜索？

使用wget -i轻松找到失败的文件

轻松的方法继续失败的reindex？

方便的方法来重新索引多指数的一个级别

简单的修复方法无法解决：junit：junit：4.12：？

什么是在事务中途提交工作的简单方法，但随后继续

Elasticsearch5.6：[reindex]无法解析字段[script]

如何继续失败的PHP循环

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？