我目前正在尝试将BigQuery中的每日Google Analytics数据(从GA自动链接到每日节奏)导出到Google云端存储中创建的存储桶。
当我使用单个通配符URI将BigQuery中的每日GA表导出到GCS时,它会自动将表拆分为多个分片文件(每个文件大约1GB)并落在GCS中指定的存储区中。但是当我将每日GA表复制到BigQuery中手动创建的表时,将手动创建的表导出到GCS会导致更多分片文件(每个文件大约300mb),即使它们具有相同的大小和行数。
我试图弄清楚为什么导出这个手动创建的表会导致BigQuery以这种方式对表进行分片。从本质上讲,这将使GCS中的文件数量增加三倍。理想情况下,我想限制GCS中分片文件的数量,因此我不需要处理这么多的文件。