内存泄漏使用StreamReader和XmlSerializer

时间:2014-05-27 19:09:42

标签: c# xml streamreader xmlserializer

我一直在谷歌搜索过去几个小时并尝试不同的东西,但似乎不能在这个底部.......

当我运行此代码时,内存使用量不断增长。

while (true)
{
    try
    {
        foreach (string sym in stringlist)
        {
            StreamReader r = new StreamReader(@"C:\Program Files\" + sym + ".xml");
            XmlSerializer xml = new XmlSerializer(typeof(XMLObj), new XmlRootAttribute("rootNode"));
            XMLObj obj = (XMLObj)xml.Deserialize(r);                       
            obj.Dispose();
            r.Dispose();
            r.Close();
        }
    }    
    catch(Exception ex) 
    {
        Console.WriteLine(ex.ToString()); 
    }
    Thread.Sleep(1000);
    Console.Clear();
}

XMLObj是一个自定义对象

[Serializable()]
public class XMLObj: IDisposable
{
    [XmlElement("block")]
    public List<XMLnode> nodes{ get; set; }

    public XMLObj() { }

    public void Dispose()
    {
        nodes.ForEach(n => n.Dispose());
        nodes= null;

        GC.SuppressFinalize(this);
    }
}

我尝试过添加GC.Collect();但这似乎没有做任何事情。

6 个答案:

答案 0 :(得分:50)

漏洞在这里:

new XmlSerializer(typeof(XMLObj), new XmlRootAttribute("rootNode"))

XmlSerializer使用程序集生成,无法收集程序集。它为最简单的构造函数方案(new XmlSerializer(Type)等)执行一些自动缓存/重用,但对于此方案,。因此,您应该手动缓存它:

static readonly XmlSerializer mySerializer =
    new XmlSerializer(typeof(XMLObj), new XmlRootAttribute("rootNode"))

并使用缓存的序列化程序实例。

答案 1 :(得分:9)

首先,即使抛出异常,您也应该处理StreamReader(对于XMLObj也是如此)。使用using语句。目前,当抛出异常时,您将不会处置。

您不太可能发生内存泄漏。更可能的是,运行时根本没有选择收集内存。即使GC.Collect也不一定会释放内存。

处理非常大的XML文件(多GB)时,我遇到了类似的情况。即使运行时占用了大部分可用内存,它也会在内存压力保证时释放它。

您可以使用Visual Studio中的内存分析器来查看分配的内存以及它所驻留的内容。

<强>更新

@KaiEichinger的评论值得研究。它表明XmlSerializer可能正在为每个循环迭代创建一个新的缓存对象定义

  

XMLSerializer构造函数使用反射为要序列化的类型创建临时程序集,因为代码生成很昂贵,所以程序集在每种类型的基础上缓存在内存中。但很多时候,根名称将被更改并且可以是动态的,并且它不会缓存动态程序集。因此,每当调用上面的代码行时,它每次都会加载新的程序集,并将保留在内存中,直到卸载AppDomain。

答案 2 :(得分:5)

来自MSDN:enter link description here

  

为了提高性能,XML序列化基础结构动态生成程序集以序列化和反序列化指定的类型。基础结构查找并重用这些程序集。仅当使用以下构造函数时才会出现此问题:

XmlSerializer.XmlSerializer(类型):

XmlSerializer.XmlSerializer(类型,字符串)

如果使用任何其他构造函数,则会生成同一程序集的多个版本,并且永远不会卸载,这会导致内存泄漏和性能下降。最简单的解决方案是使用前面提到的两个构造函数之一。否则,必须将程序集缓存在Hashtable中,如以下示例所示。

=&GT;因此,要修复它,您必须使用此构造函数XmlSerializer xml = new XmlSerializer(typeof(XMLObj))而不是XmlSerializer xml = new XmlSerializer(typeof(XMLObj), new XmlRootAttribute("rootNode"));

并将根XML属性添加到XMLObj类中。

[Serializable()]
[XmlRoot("root")]
public class XMLObj: IDisposable
{
    [XmlElement("block")]
    public List<XMLnode> nodes{ get; set; }

    public XMLObj() { }

    public void Dispose()
    {
        nodes.ForEach(n => n.Dispose());
        nodes= null;

        GC.SuppressFinalize(this);
    }
}

答案 3 :(得分:2)

我正在使用“缓存”类来避免每次需要序列化某些东西时实例化xmlserializer(还添加了一个XmlCommentAttribute用于向xml输出中的序列化属性添加注释),对我来说它像sharm一样工作,希望有所帮助有人这样:

 public static class XmlSerializerCache
{
    private static object Locker = new object();
    private static Dictionary<string, XmlSerializer> SerializerCacheForUtils = new Dictionary<string, XmlSerializer>();

    public static XmlSerializer GetSerializer<T>()
    {
        return GetSerializer<T>(null);
    }
    public static XmlSerializer GetSerializer<T>(Type[] ExtraTypes)
    {
        return GetSerializer(typeof(T), ExtraTypes);
    }
    public static XmlSerializer GetSerializer(Type MainTypeForSerialization)
    {
        return GetSerializer(MainTypeForSerialization, null);
    }
    public static XmlSerializer GetSerializer(Type MainTypeForSerialization, Type[] ExtraTypes)
    {
        string Signature = MainTypeForSerialization.FullName;
        if (ExtraTypes != null)
        {
            foreach (Type Tp in ExtraTypes)
                Signature += "-" + Tp.FullName;
        }

        XmlSerializer XmlEventSerializer;
        if (SerializerCacheForUtils.ContainsKey(Signature))
            XmlEventSerializer = SerializerCacheForUtils[Signature];
        else
        {
            if (ExtraTypes == null)
                XmlEventSerializer = new XmlSerializer(MainTypeForSerialization);
            else
                XmlEventSerializer = new XmlSerializer(MainTypeForSerialization, ExtraTypes);

            SerializerCacheForUtils.Add(Signature, XmlEventSerializer);
        }
        return XmlEventSerializer;
    }

    public static T Deserialize<T>(XDocument XmlData)
    {
        return Deserialize<T>(XmlData, null);
    }
    public static T Deserialize<T>(XDocument XmlData, Type[] ExtraTypes)
    {
        lock (Locker)
        {
            T Result = default(T);
            try
            {
                XmlReader XmlReader = XmlData.Root.CreateReader();
                XmlSerializer Ser = GetSerializer<T>(ExtraTypes);
                Result = (T)Ser.Deserialize(XmlReader);
                XmlReader.Dispose();
                return Result;
            }
            catch (Exception Ex)
            {
                throw new Exception("Could not deserialize to " + typeof(T).Name, Ex);
            }
        }
    }
    public static T Deserialize<T>(string XmlData)
    {
        return Deserialize<T>(XmlData, null);
    }
    public static T Deserialize<T>(string XmlData, Type[] ExtraTypes)
    {
        lock (Locker)
        {
            T Result = default(T);
            try
            {

                using (MemoryStream Stream = new MemoryStream())
                {
                    using (StreamWriter Writer = new StreamWriter(Stream))
                    {
                        Writer.Write(XmlData);
                        Writer.Flush();
                        Stream.Position = 0;
                        XmlSerializer Ser = GetSerializer<T>(ExtraTypes);
                        Result = (T)Ser.Deserialize(Stream);
                        Writer.Close();
                    }
                }
                return Result;
            }
            catch (Exception Ex)
            {
                throw new Exception("Could not deserialize to " + typeof(T).Name, Ex);
            }
        }
    }

    public static XDocument Serialize<T>(T Object)
    {
        return Serialize<T>(Object, null);
    }
    public static XDocument Serialize<T>(T Object, Type[] ExtraTypes)
    {
        lock (Locker)
        {
            XDocument Xml = null;
            try
            {
                using (MemoryStream stream = new MemoryStream())
                {
                    XmlSerializerNamespaces ns = new XmlSerializerNamespaces();
                    ns.Add("", "");

                    using (StreamReader Reader = new StreamReader(stream))
                    {
                        XmlSerializer Serializer = GetSerializer<T>(ExtraTypes);
                        var settings = new XmlWriterSettings { Indent = true };
                        using (var w = XmlWriter.Create(stream, settings))
                        {
                            Serializer.Serialize(w, Object, ns);
                            w.Flush();
                            stream.Position = 0;
                        }
                        Xml = XDocument.Load(Reader, LoadOptions.None);

                        foreach (XElement Ele in Xml.Root.Descendants())
                        {
                            PropertyInfo PI = typeof(T).GetProperty(Ele.Name.LocalName);
                            if (PI != null && PI.IsDefined(typeof(XmlCommentAttribute), false))
                                Xml.AddFirst(new XComment(PI.Name + ": " + PI.GetCustomAttributes(typeof(XmlCommentAttribute), false).Cast<XmlCommentAttribute>().Single().Value));
                        }

                        Reader.Close();
                    }
                }
                return Xml;
            }
            catch (Exception Ex)
            {
                throw new Exception("Could not serialize from " + typeof(T).Name + " to xml string", Ex);
            }
        }
    }
}

[AttributeUsage(AttributeTargets.Property, AllowMultiple = false)]
public class XmlCommentAttribute : Attribute
{
    public string Value { get; set; }
}

答案 4 :(得分:0)

我认为将XMLSerializer构造函数移到循环之外并缓存其结果将解决它,解释here

答案 5 :(得分:0)

我最近在使用最新的.NET Core 3.1时遇到了同样的问题,并且缓存XMLSerializer(在此处提出)可以解决问题。发生此内存泄漏的最糟糕的事情是无法从内存转储中明确定位,我尝试了Jetbrains的dotMemory,根据分析的转储结果,一切似乎都正常,但应用程序使用的内存量(转储大小)并且dotMemory报告中显示的应用程序使用的内存量显着不同。 dotMemory显示APP仅使用了几MB的内存。我本来以为该问题是由WCF引起的,当合同(WSDL)使用与utf-8不同的编码时,尤其是当合同在方法名称中包含点时,使它在.NET Core中工作确实很难。服务器端用PHP编写).Net Framework不会有问题,但是.Net Core的工具有所不同。我必须手动调整WSDL并添加.Net Core实现中缺少的一些类,才能针对不同的编码进行工作。