我正在使用s3 select
来读取存储在S3存储桶中的大型实木复合地板文件的前10行。我能够获得csv
格式的前10行,但是它没有任何标题。它仅包含没有任何列名的行。
是否可以像我们或CSV文件一样获取该镶木地板文件的标头?在CSV文件中,我们可以将FileHeaderInfo
参数设置为IGNORE
来获取标题。无论如何,实木复合地板文件也要这样做吗?
如果没有,还有什么其他方法可以读取此镶木地板文件的前10行,这样我就可以获得镶木地板数据的标头?
我正在阅读S3使用文档中所述的InputSerialization
逻辑进行选择:
SelectObjectContentRequest request = new SelectObjectContentRequest();
request.setBucketName(bucket);
request.setKey(key);
request.setExpression(query);
request.setExpressionType(ExpressionType.SQL);
InputSerialization inputSerialization = new InputSerialization();
inputSerialization.setParquet(new ParquetInput());
inputSerialization.setCompressionType(CompressionType.NONE);
request.setInputSerialization(inputSerialization);
OutputSerialization outputSerialization = new OutputSerialization();
outputSerialization.setCsv(new CSVOutput());
request.setOutputSerialization(outputSerialization);
return request;