标签: java file csv amazon-s3
我们需要处理每天生成的存储在S3上的大型CSV文件。 我们希望根据每行中给出的类别将数据拆分为小文件。因此,我们逐行阅读并使用流处理它以避免内存问题。我能够根据行数将文件拆分成多个文件,但我无法根据类别拆分它,因为行不是连续的。
有人能指出我正确的方向,如何在解析大文件时根据类别将数据写入多个文件?