我有这样的数据:schema1,a1,a2,...,an,schema2,b1,b2,....,bm。我确切知道每个架构有多少数据项。我可以在一个AVRO文件中编写两个模式/数据,而不是两个吗?
dataFileWrite API仅提供create()。我没有append()来编写第一个模式的最后一个数据项之后的第二个模式。
答案 0 :(得分:1)
您应该使用Schema.createUnion(schema1,schema2)创建一个新的联合模式,并使用该模式作为文件的编写器模式。在读取数据时,如果文件中包含这两种类型,或者只有您知道存在的模式,则可以再次使用联合模式。