我正在使用JSON作为中间格式从旧的专业对象数据库格式迁移数据。这些对象被输出到JSON对象数组中,每个对象都有一个初始字段,给出原始对象的类型,后跟名为Instance的字段,该字段具有嵌套的原始对象。
我需要将它们流式传输,因为它们可能有数十万个 - 我不能只将整个JSON数组读入内存然后进行处理。
所以JSON看起来像这样:
[
{
"Type": "Foo",
"Instance": {
// instance of Foo type
}
},
{
"Type": "Bar",
"Instance": {
// instance of Bar type
}
},
// tens or hundreds of thousands more objects...
]
使用Json.NET,一次流入一个数组元素的最佳方法是什么,访问“Type”属性,然后将“Instance”反序列化为相应类型的.Net对象?
编辑:虽然有关于阅读大型JSON数组的类似问题,但在该问题中没有回答访问该实例的细节。
答案 0 :(得分:1)
汇总答案
首先,假设您有一个自定义SerializationBinder
(或类似的东西),它会将类型名称映射到类型。
接下来,您可以使用以下扩展方法枚举流式JSON数据中的顶级对象(将走进顶级数组):
public static class JsonExtensions
{
public static IEnumerable<JObject> WalkObjects(TextReader textReader)
{
using (JsonTextReader reader = new JsonTextReader(textReader))
{
while (reader.Read())
{
if (reader.TokenType == JsonToken.StartObject)
{
JObject obj = JObject.Load(reader);
if (obj != null)
{
yield return obj;
}
}
}
}
}
}
然后,假设您有一些stream
用于读取JSON数据,您可以将JSON流转换并逐个转换顶级数组元素,以进行如下处理:
SerializationBinder binder = new MyBinder(); // Your custom binder.
using (var stream = GetStream(json))
using (var reader = new StreamReader(stream, Encoding.Unicode))
{
var assemblyName = System.Reflection.Assembly.GetExecutingAssembly().GetName().Name;
var items = from obj in JsonExtensions.WalkObjects(reader)
let jType = obj["Type"]
let jInstance = obj["Instance"]
where jType != null && jType.Type == JTokenType.String
where jInstance != null && jInstance.Type == JTokenType.Object
let type = binder.BindToType(assemblyName, (string)jType)
where type != null
select jInstance.ToObject(type); // Deserialize to bound type!
foreach (var item in items)
{
// Handle each item.
Debug.WriteLine(JsonConvert.SerializeObject(item));
}
}