我担心IOT的实时流处理是通过GCD pub / sub,Cloud Dataflow和通过BigQuery执行分析。我正在寻求如何实现这一点的帮助。 Here is the architecture for IOT real-time stream processing
答案 0 :(得分:1)
我假设您的意思是要将某些数据从Google Cloud Platform外部传输到BigQuery。
除非您以某种方式转换数据,否则我认为数据流不是必需的。
请注意,BigQuery有自己的Streaming API,因此您不必使用Pub / Sub将数据导入BigQuery。
在任何情况下,这些都是您应该遵循的步骤。
如果您只想将非常原始数据(无处理)放入BQ,那么我建议使用第一种方法。
如果你真的想以某种方式转换数据,那么我会使用第二种方法,因为它允许你先按下数据。
但是,我通常总是建议使用第一种方法,即使你想以某种方式转换数据。
这样,您的数据集中有一个data_dump
表(原始数据),之后您仍然可以使用DataFlow转换数据并将其 返回 进入aggregated
表。
这为您提供了最大的灵活性,因为它允许您从BQ中的单个n
表创建可能data_dump
转换的数据集。