我使用 flink-1.0-SNAPSHOT 来使用来自kafka的数据。数据以 Snappy压缩 byte []的形式传入,传递给thrift供以后使用。
当我使用 flink 检索数据时,它会以某种方式被破坏或处理不当,导致无法解压缩。代码源自this样本,如下所示:
DataStream<String> messageStream = env.addSource(new FlinkKafkaConsumer081<>(parameterTool.getRequired("topic"), new SimpleStringSchema(), parameterTool.getProperties()));
messageStream.rebalance().map(new MapFunction<String, String>() {
@Override public String map(String value) throws Exception {
boolean bvalid = Snappy.isValidCompressedBuffer(value.getBytes());
});
isValidCompressedBuffer 每次都返回false。
通过其他途径消费时,已知数据很好。
我错过了什么?
我发布这个,因为我找不到任何使用RawSchema
的例子。
public static void main(String[] args) throws Exception {
// create execution environment
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
// parse user parameters
ParameterTool parameterTool = ParameterTool.fromArgs(args);
DataStream<byte[]> dataStream = env.addSource(new FlinkKafkaConsumer081<>(parameterTool.getRequired("topic"), new RawSchema(), parameterTool.getProperties()));
dataStream.map(new MapFunction<byte[], Object>() {
@Override
public Object map(byte[] bytes) throws Exception {
boolean bvali = Snappy.isValidCompressedBuffer(bytes);
});
return 0;
}
}).print();
env.execute();
}
答案 0 :(得分:2)
将字节消息读取为String不正确。 您应该按原样读取字节然后解压缩:
public Object map(byte[] bytes) throws Exception {
boolean bvalid = Snappy.isValidCompressedBuffer(bytes);
...