Question

现在我正在Flink与RocksDB中使用增量检查点，该检查点在容器环境中运行。据我所知，rocksdb在执行增量检查点时会使用大量内存，已经有一个JIRA描述了这个问题： https://issues.apache.org/jira/browse/FLINK-7289 我试图调整Rocksdb的配置，但是我的容器仍然因为OOM而被杀死。这是监视器页面：我的容器将被杀死，然后重新启动，然后再次被杀死。

这是我的配置：

public class BackendOptions implements OptionsFactory {

@Override
public DBOptions createDBOptions(DBOptions dbOptions) {
    return dbOptions
            .setIncreaseParallelism(4)
            .setUseFsync(false)
            .setMaxOpenFiles(-1);

}
@Override
public ColumnFamilyOptions createColumnOptions(ColumnFamilyOptions columnFamilyOptions) {
    return columnFamilyOptions.setCompactionStyle(CompactionStyle.LEVEL)
            .setLevelCompactionDynamicLevelBytes(true)
            .setTargetFileSizeBase(256 * 1024 * 1024)
            .setWriteBufferSize(64 * 1024 * 1024)
            .setMaxBytesForLevelBase(1024 * 1024 * 1024)
            .setMinWriteBufferNumberToMerge(2)
            .setMaxWriteBufferNumber(5)

            .setOptimizeFiltersForHits(true)
            .setTableFormatConfig(
                    new BlockBasedTableConfig()
                            .setBlockCacheSize(256 * 1024 * 1024)  // 256 MB
                            .setBlockSize(128 * 1024) //// 128 KB
                            .setCacheIndexAndFilterBlocks(true)
            );
}

我每1分钟进行一次检查，状态大小约为5GB。有人可以帮我还是告诉我一些使用增量检查点的正确方法？

Answer 1

这似乎在较新版本的 Flink 中得到修复，即 1.10 及更高版本。问题是关于 2019 年，到 2020 年 2 月，相关问题已关闭。

详情请见此处https://issues.apache.org/jira/browse/FLINK-7289

用rocksdb Flink增量检查点会占用大量内存

1 个答案: