我有bz2
格式的一堆(大的,每个10GB)文件。我想上传它们,然后对它们执行一些查询。大查询“理解”bzip,因为它是gzip吗?我应该转换它们吗?什么是上传它们的最佳方式?
答案 0 :(得分:1)
我假设文件是CSV或JSON格式。根据BigQuery文档(https://cloud.google.com/bigquery/preparing-data-for-loading),仅支持gzip
压缩。即使支持bz2
,也不会使用10GB大小的压缩文件。问题是,与未压缩文件不同--BigQuery无法将它们拆分成碎片,并且必须使用整个10GB文件,这将非常慢。