标签: apache-spark hadoop hdfs
如何在写入HDFS之前估计文件的大小?我正在使用Apache Spark进行此练习。我从HDFS读取文件并应用过滤器,然后写回HDFS,但在写入HDFS之前,想知道文件大小。