Ram中的C#2Gb文件是4gb。为什么?

时间:2013-05-08 13:33:07

标签: c# file filestream textreader

我在文件中读取(此文件由一个长度为2gb的长字符串组成)。

这是我的函数,它将文件的所有内容读入内存,然后拆分字符串并放置: * reader = StreamReader

public List<char[]> GetAllContentAsList()
        {
            int bytesToRead = 1000000;
            char[] buffer = new char[bytesToRead];
            List<char[]> results = new List<char[]>();

            while (_reader.Read(buffer, 0, bytesToRead) != 0)
            {
                char[] temp = new char[bytesToRead];
                Array.Copy(buffer,temp,bytesToRead);
                results.Add(temp);
            }

            return results;
        }

当所有数据放入List时,RAM占用4gb。当文件大小只有2GB时,这怎么可能?

*编辑

这就是我最终做的事情。我没有将字节数组转换为字符串,我只是在操作它们时传递字节。这个场景只有2Gb而不是4gb

 public List<byte[]> GetAllContentAsList()
            {
                int bytesToRead = 1000000;
                var buffer = new byte[bytesToRead];
                List<byte[]> results = new List<byte[]>();

                while (_reader.Read(buffer, 0, bytesToRead) != 0)
                {
                    //string temp = Encoding.UTF8.GetString(buffer);
                    byte[] b = new byte[bytesToRead];
                    Array.Copy(buffer,b,bytesToRead);
                    results.Add(b);
                }

                return results;
            }

1 个答案:

答案 0 :(得分:16)

受过教育的猜测:

文件是UTF-8ASCII编码的,并且(大部分)仅包含单字节宽字符(或者可能是其他一些主要是单字节宽的代码页)。

现在,.NET字符为UTF-16,其长度均为2(或更多)字节。

因此,在内存中,字符的大小将增加一倍。