标签: apache-beam
我有两个问题。 第一。 我使用我的项目光束,数据是jsonobject。在流中,数据将多次可序列化和反序列化,但是我不知道在哪里使用可序列化和反序列化,因为这个问题使我花了很多时间,所以可以您请告诉我是否可以关闭它,只能在读写时序列化。 第二。 我使用Beam并在spark上运行,但是我发现一个问题,一些键具有很多值,并且创建数据Slant,所以我想知道是否有一些方法可以解决。我尝试使用Reshuffle.of(),没有有效果。