s3 select:如何获取镶木地板文件的列名?

时间:2019-08-11 07:43:07

标签: java amazon-s3 aws-sdk parquet amazon-s3-select

我正在使用s3 select来读取存储在S3存储桶中的大型实木复合地板文件的前10行。我能够获得csv格式的前10行,但是它没有任何标题。它仅包含没有任何列名的行。

是否可以像我们或CSV文件一样获取该镶木地板文件的标头?在CSV文件中,我们可以将FileHeaderInfo参数设置为IGNORE来获取标题。无论如何,实木复合地板文件也要这样做吗?

如果没有,还有什么其他方法可以读取此镶木地板文件的前10行,这样我就可以获得镶木地板数据的标头?

我正在阅读S3使用文档中所述的InputSerialization逻辑进行选择:

        SelectObjectContentRequest request = new SelectObjectContentRequest();
        request.setBucketName(bucket);
        request.setKey(key);
        request.setExpression(query);
        request.setExpressionType(ExpressionType.SQL);

        InputSerialization inputSerialization = new InputSerialization();
        inputSerialization.setParquet(new ParquetInput());
        inputSerialization.setCompressionType(CompressionType.NONE);
        request.setInputSerialization(inputSerialization);

        OutputSerialization outputSerialization = new OutputSerialization();
        outputSerialization.setCsv(new CSVOutput());
        request.setOutputSerialization(outputSerialization);

        return request;

0 个答案:

没有答案