如何使用apache avro SchemaBuilder更新现有的avro架构?

时间:2017-08-22 12:40:40

标签: java apache avro

我正在测试一个新的模式注册表,它可以加载和检索不同类型的avro模式。在测试过程中,我需要创建一堆不同类型的avro架构。由于它涉及很多排列,我决定以编程方式创建模式。 我正在使用apache avro SchemaBuilder这样做。

我使用以下方法创建了avro:

Schema oldSchema = SchemaBuilder
      .record("abc")
      .aliases("records")
      .fields()
      .name("field_null")
      .type("null")
      .noDefault()
      .endRecord();

这很有用。创建的avro看起来像:

{
 "type" : "record",
 "name" : "abc",
 "fields" : [ {
   "name" : "field_null",
   "type" : "null"
  } ],
  "aliases" : [ "records" ]
}

现在我想使用apache avro库创建一个新版本的模式,如:

{
 "type" : "record",
 "name" : "abc",
 "fields" : [ {
   "name" : "field_null",
   "type" : "null"
  },
  {
   "name" : "new_field",
   "type" : "int",
   "default" : 10
  }
 ],
 "aliases" : [ "records" ]
}

为此,我试过了:

Schema.Field field = new Schema.Field("new_field", SchemaBuilder.builder().intType(),
    "NewField", 10);

List<Schema.Field> fields = new ArrayList<>();
fields.add(field);
fields.addAll(oldSchema.getFields());

Schema record = Schema.createRecord(oldSchema.getName(),
    "Changes",
    oldSchema.getNamespace(),
    false,
    fields);

我明白了:

org.apache.avro.AvroRuntimeException: Field already used: field_null type:NULL pos:0

at org.apache.avro.Schema$RecordSchema.setFields(Schema.java:647)
at org.apache.avro.Schema$RecordSchema.<init>(Schema.java:618)
at org.apache.avro.Schema.createRecord(Schema.java:167)

我的问题是:

  1. 如何使用现有库添加新版本的架构?
  2. 我应该使用avro schemaBuilder来创建架构,还是创建自己的POJO来构建架构/将avsc文件保存在数据目录中。

2 个答案:

答案 0 :(得分:0)

你可以试试这个来创建字段,也许它很笨拙:

C3

答案 1 :(得分:0)

要将旧架构中的字段复制到新架构,您必须对@xiping xing建议的每个字段执行深层复制。

这是因为Schema类检查该字段仅添加一次到一个模式,在这种情况下,这些字段已经添加到旧模式中。

您可以在Avro 1.7.7

中看到他们如何在此代码段中使用标记
@Override
public void setFields(List<Field> fields) {
  if (this.fields != null) {
    throw new AvroRuntimeException("Fields are already set");
  }
  int i = 0;
  fieldMap = new HashMap<String, Field>();
  LockableArrayList ff = new LockableArrayList();
  for (Field f : fields) {
    if (f.position != -1)
      throw new AvroRuntimeException("Field already used: " + f);
    f.position = i++;
    final Field existingField = fieldMap.put(f.name(), f);
    if (existingField != null) {
      throw new AvroRuntimeException(String.format(
          "Duplicate field %s in record %s: %s and %s.",
          f.name(), name, f, existingField));
    }
    ff.add(f);
  }
  this.fields = ff.lock();
  this.hashCode = NO_HASHCODE;
}