在C#中查找内存映射文件中的元素

时间:2011-06-07 09:14:55

标签: c# visual-studio-2010 memory-management

我需要在内存映射文件中找到某些元素。我已设法映射文件,但是我在查找元素时遇到了一些问题。我的想法是将所有文件元素保存到列表中,然后搜索该列表。

如何创建一个返回包含映射文件所有元素的列表的函数?

// Index indicates the line to read from
public List<string> GetElement(int index) {

}

我映射文件的方式:

    public void MapFile(string path)
    {
        string mapName = Path.GetFileName(path);
        try
        {
            // Opening existing mmf
             if (mapName != null)
             {
                 _mmf = MemoryMappedFile.OpenExisting(mapName);
             }

             // Setting the pointer at the start of the file
             _pointer = 0;

             // We create the accessor to read the file
             _accessor = _mmf.CreateViewAccessor();

             // We mark the file as open
             _open = true;
        }
        catch (Exception ex) {....}

        try
        {
            // Trying to create the mmf
            _mmf = MemoryMappedFile.CreateFromFile(path);

            // Setting the pointer at the start of the file
             _pointer = 0;

            // We create the accessor to read the file
            _accessor = _mmf.CreateViewAccessor();

            // We mark the file as open
            _open = true;
        }
        catch (Exception exInner){..}
    }

我映射的文件是UTF-8 ASCII文件。没什么奇怪的。

我做了什么:

    var list = new List<string>();

    // String to store what we read
    string trace = string.Empty;

    // We read the byte of the pointer
    b = _accessor.ReadByte(_pointer);

    int tracei = 0;
    var traceb = new byte[2048];

    // If b is different from 0 we have some data to read
    if (b != 0)
    {
        while (b != 0)
        {
            // Check if it's an endline
            if (b == '\n')
            {
                trace = Encoding.UTF8.GetString(traceb, 0, tracei - 1);

                list.Add(trace);
                trace = string.Empty;

                tracei = 0;
                _lastIndex++;
            }
            else
            {
                traceb[tracei++] = b;
            }

            // Advance and read
            b = _accessor.ReadByte(++_pointer);
        }
    }

代码很难为人类阅读,效率不高。我该如何改进呢?

1 个答案:

答案 0 :(得分:1)

您正在重新发明StreamReader,它正是您所做的。您真正想要内存映射文件的几率非常低,它们需要大量的虚拟内存,如果您在不同的偏移处重复读取相同的文件,您只能获得回报。这是不太可能的,文本文件必须按顺序读取,因为你不知道这些行是多长时间。

这使得一行代码可能是您发布内容的最佳替代品:

string[] trace = System.IO.File.ReadAllLines(path);