我有一个Google Cloud功能,可以生成存储在Google云端硬盘中的文件。 我想在Big Query中加载这些文件。
直接从函数中加载数据(跳过文件生成,仅在BigQuery中进行某种插入)与从Google云端硬盘中加载数据有何利弊?
我感兴趣的不仅是技术方面的问题和成本,还包括数据处理方法方面的问题。
我认为这个问题可能会导致在线困境或在批处理过程中导致更多困境。
PS:这听起来可能与this帖子重复,但并不完全相同。
答案 0 :(得分:2)
本地可用文件(在Cloud功能中)
如果文件是在cloud函数内生成的(在其本地环境中0,则加载它与从本地文件系统加载非常相似。这是归结为:
缺点:
优点:
云存储桶(GCS)中可用的文件
另一方面,如果您决定将云功能中本地生成的文件发送到GCS,然后将其导出到BQ:
优点:
缺点: