当我们拥有相同的数据(例如制表符分隔文件(TSF)或逗号分隔文件(CSV)或纯文本文件时,任何人都可以建议最小的文件大小数据格式将是非常有用的,其中任何特定的分隔符或任何其他。
希望我们能够在了解最小的文件格式后使用GZip或7zip压缩文件。
答案 0 :(得分:0)
我尝试过JSON,BSON,YAML,协议缓冲区,Avro,XML格式
Yaml的可读性与JSON格式类似,但它消耗的内存很大。 XML显而易见,它也消耗了巨大的内存 Proto Buffer和Avro优于CSV& TSV文件的大小,但数据是非人类可读的格式。 我的建议是使用符合可读性和大小调整的JSON。此外,API还可以轻松解析JSON。