标签: cloud data-warehouse parquet orc
我想知道使用ORC和Parquet格式存储长文本的适当数据类型是什么。这两种格式中的任何一种都有其默认字符串类型的长度/大小限制吗?
感谢。
答案 0 :(得分:1)
Apache Parquet中的默认字符串类型UTF8没有长度限制,您可以在其中保存任意长度的字符串。这是一个可变长度类型,即只在生成的文件中使用存储的字符串的长度。
UTF8