python elasticsearch bulk:动作/元数据格式错误

时间:2018-11-17 08:58:48

标签: python elasticsearch

我编写了一段代码,旨在使用 python elasticsearch 的{{1将IRC eggdrop 日志注入到 elasticsearch 6.4数据库中}}。它是使用3.7版的 python 编写的,并在 NetBSD Linux Mac OS X 上进行了测试。 /> 某些日志文件已导入,但某些日志文件因此错误而失败:

bulk

我阅读了许多 elastic.co 论坛帖子,并给出了SO答案,其中OP的数据集存在格式错误,缺少字段,但我找不到我的。此外,同样,并非所有日志文件都被此错误拒绝。

我正在查看一个编码错误,但是似乎所有文件都在该区域。

  • Here是产生此错误的示例文件。这是100%有效的 JSON
  • Here是python代码。

想法?

1 个答案:

答案 0 :(得分:2)

在json响应中,json中包含换行符。 _source的值之一为null。 Python无法将它们视为字典。在形成批量请求时,请清理完整的数据并点击批量API。

第192个索引处的Json的null为_source。

Json在第47索引处有换行符。

请在导出到Elasticsearch时清除这些数据。

希望这会有所帮助。