有没有办法估计BigQuery中的表或字段大小?

时间:2013-11-11 12:45:48

标签: google-bigquery

我正在设计一个将用于分析的架构。为了正确决定数据的去规范化程度,我需要估计目标模式中列的大小。 我正在寻找一种方法来根据我拥有的信息(数据类型,基数,平均(或百分位数)字符串长度,记录数等)预测BQ表中列的大小。)

是否有任何启发式或其他方法来粗略估计列大小?

由于

1 个答案:

答案 0 :(得分:4)

BigQuery字段的大小基于类型:

  • BOOLEAN:1个字节
  • INTEGER:8个字节
  • FLOAT:8个字节
  • TIMESTAMP:8个字节
  • STRING:UTF8编码长度+2个字节

有一些特殊情况:

  • NULL值(对于任何类型):0字节
  • 重复字段:重复字段中值的大小总和。