Text.IO.ReadAll

时间:2018-04-17 17:19:22

标签: java google-cloud-platform google-cloud-dataflow

我必须将30个GCS文件夹中的json文件作为String读取到数据流管道中。我没有为每个步骤添加Text.IO.Read步骤,而是希望使用Text.IO.ReadAll。任何想法我如何设置它来从多个文件夹中读取。

找到this但我的案例中的文件夹名称位于List<String>而不是PCollection<String>

// E.g. the filenames might be computed from other data in the pipeline, or
 // read from a data source.
 PCollection<String> filenames = ...;

 // Read all files in the collection.
 PCollection<String> lines = filenames.apply(TextIO.readAll());

我必须阅读的每个GCS文件夹都有500个文件。

1 个答案:

答案 0 :(得分:1)

使用Create.of()从列表中创建PCollection。