自动决定文档类型

时间:2014-05-18 18:49:24

标签: elasticsearch

我有一个包含两种不同类型文档的大型数据库,我希望它们在ES中作为ES术语中的不同文档类型进行索引。但我不想预先过滤我的数据库。

是否可以配置ES以便在索引期间根据其结构设置文档的类型?

提供更多信息:

我从twitter api索引推文。但我不仅有json格式的推文,还有json文档,这些文件说删除数据库中的推文。 我想索引这两个文档,以便它们是唯一的。对于推文,我确保通过将映射ID设置为具有映射的文档ID。但是我不能在删除文档上做同样的事情,因为那时我会覆盖推文。通过将它们设置为不同的文档来分隔两者,但两者都使用相同的ID,这样可以确保这一点,但我会打开其他建议。

删除文档如下所示:

{"delete":
    {"status":
        {"id":417427762463649792,
        "user_id":608116073,
        "id_str": "417427762463649792",
        "user_id_str":"608116073"}
    }
}

这样的推文(摘录):

{"created_at":
    "Sun Dec 29 22:59:59 +0000 2013",
    "id":417429821849743360
[...]
}

我想用stream2es或elasticsearch-hadoop索引。

谢谢!

0 个答案:

没有答案