Apache Beam Pipeline I / O具有两个用于读取文本文件的功能:beam.io.ReadFromText()
和beam.io.ReadAllFromText()
。但是,我无法理解它们之间的区别以及在哪里使用哪一个。
这两个函数还具有参数min_bundle_size
根据文档:https://beam.apache.org/releases/pydoc/2.9.0/apache_beam.io.textio.html
min_bundle_size
–应生成的捆绑软件的最小大小 将此来源拆分为多个包时。
我也可以知道它的功能吗。