我终于设法拆分了一个大文件并重新聚合成更小的(但仍然非常大的文件)
在写作结束时,我有每个文件中的记录数。这需要作为标题添加到每个较小的文件中。
以高效的方式实现这一目标的最佳方法是什么?
我考虑过的可能性:
我遇到了如何以非轮询方式读取文件以及如何触发concat阶段的问题。这需要重写整个大文件
将文件头保留在邮件头或交换中,当写入所有文件时,从目录中读取所有文件,找到匹配的头文件并将其添加到输出中。 这需要重写整个大文件
为计数数据添加一个带有占位符的虚拟标题,并以某种方式修改数据文件.... 这似乎是最有效的,但不知道如何做到这一点
标题:3条记录
一
B'/ P>
C