ParquetFileReader导致处于CLOSE_WAIT状态的TCP连接过多

时间:2020-10-11 09:26:53

标签: java hadoop bigdata parquet parquet-mr

我正在尝试从实木复合地板文件中读取元数据信息:

metaData=ParquetFileReader.readFooter(fs.getConf(),file) ;

此行以CLOSE_WAIT状态打开连接(使用lsof -p pid命令检查)。

TCP rack162-hdp26-dev:36608->rack162-hdp26-dev:1019 (CLOSE_WAIT)

在超过65,536个文件上,它返回“打开的文件太多”的错误(因此需要重新启动我的应用程序)。我尝试用替换:

try (ParquetFileReader r = ParquetFileReader.open(fs.getConf(), file)) {

     logger.info("Getting metadata for:" + file.toString());
     metaData = r.getFooter()

     //other code//
}

,但仍然面临问题。我已经尝试过版本1.8.1、1.10.1、1.11.1的镶木地板-jar罐,但是每个罐都存在问题。

0 个答案:

没有答案