我有一个用例,该用例具有潜在的大地图,具有要在多台计算机上分发的值,以便执行流处理。 Apache Flink是否可以在集群模式下使用MapState来实现?还是只能在同一台机器的多个线程上并行化计算? KeyedStream是否提供实现此目的的方法?
答案 0 :(得分:1)
MapState是一种键分区状态,其中群集中的每个节点负责键空间的一些不相交的子集。 MapState与KeyedStreams一起使用,您实际上可以得到一个分片的键/值存储库,其中的值本身就是映射。
您可能正在寻找ValueState<T>
,在这种情况下,您将拥有与每个键关联的T类型的对象。