在谷歌Bigquery ....我已经成功加载后从googlstorage加载了一个1.5GB的csv文件,....我的表大小是250MB,为什么会这样?
答案 0 :(得分:6)
可能因为数字的二进制编码比将它们编码为字符串更有效。例如,字符串"1234567890"
需要10个字节(至少,如果是UTF-16编码,则为20个字节),但它可以用4字节整数表示,只需4个字节。
此外,bigquery中的表也可以省略分隔符,因为它知道每个字段的宽度是多少字节。这是为每个,
保存的另一个字节。