应用错误收集

在hazelcast中批量加载数据的最佳方法

时间：2016-05-25 09:18:37

标签： hazelcast

我需要使用csv / flat文件在hazelcast中加载3亿条记录（每条记录60KB）。以最快的方式加载所有这些数据的最佳方法是什么？我可以通过记录阅读记录并在hazelcast中执行map.put。有没有办法在一个map.put中执行多次写入？或者有没有可以做到这一点的实用工具？

2 个答案:

答案 0 :(得分：3)

除了Chris的评论之外，您还可以在Hazelcast Simulator代码库中找到异步加载器/流转化器的示例。此代码用于在测试之前将数据加载到网格。 AsyncMapStreamer。作为选项，您可以使用select date(max(a)) from (select TIMESTAMP('20160523') as a), (select TIMESTAMP('20170301') as a)方法。但在这种情况下，您需要找到临时地图的最佳批量大小。

干杯，维克

答案 1 :(得分：0)

您应该使用IMap :: setAsync或IMap :: putAll。可能第一个选项更快，因为它完全是异步并且没有返回任何值，这可以优化网络流量。

无论如何，加速的最重要因素是序列化。如果您使用Java对象，您应该考虑使用DataSerializable来优化序列化。