我有一个带有第一个模式的avro文件,然后我更新了附加到同一文件的模式。所以现在我在一个文件中有两个模式。 avro如何处理这种情况。我是否会在文件中添加任何新字段,或者在读取此数据时是否会丢失任何数据。这是一个实时流应用程序,我将数据写入hdfs。我的上游系统可能会更新架构,但hdfs编写器可能在旧架构上。所以hdfs avro文件将有两个模式,直到我更新编写器来处理更新的模式。
注意 - 我没有架构注册表,我每天都会创建一个avro文件。因此,如果在一天中间更新架构,我将有一个带有两个架构的avro文件。
答案 0 :(得分:0)
与Thrift不同,Avro不会在数据中保存有关avro架构的任何元信息。